干部學(xué)習(xí)講稿:大數(shù)據(jù)在醫(yī)療領(lǐng)域的應(yīng)用(下)
寧家駿
國家信息化專家咨詢委員會(huì)委員
二、大數(shù)據(jù)與云計(jì)算相向而行、發(fā)展迅速
(三)大數(shù)據(jù)時(shí)代及其特點(diǎn)
我們說現(xiàn)在我們進(jìn)入大數(shù)據(jù)時(shí)代,為什么叫大數(shù)據(jù)時(shí)代?大家知道,是因?yàn)槿祟惽斑M(jìn)的腳步有了重大的變化,我們已經(jīng)從農(nóng)業(yè)社會(huì)進(jìn)入到工業(yè)社會(huì),又從工業(yè)社會(huì)進(jìn)入到了信息社會(huì),當(dāng)今我們面臨著一個(gè)生活、工作和思維方式的巨大變革的時(shí)期,就是我們說的大數(shù)據(jù)的時(shí)代。
為什么叫大數(shù)據(jù)時(shí)代呢?也是因?yàn)槲覀內(nèi)祟悓?duì)信息的利用和認(rèn)識(shí)的手段,經(jīng)過了5次巨大的變革。比如開始最早的時(shí)候,我們的猿人,我們的先祖直立起來,能夠進(jìn)行語言的交換,這是第一輪。之后,在公元3500年有了文字。之后,大家知道是我們國家的驕傲,到了15世紀(jì),我們畢升發(fā)明了活字印刷。到了19世紀(jì)開始有了電子,比如說電話、廣播。到了上世紀(jì)有了電視。但是現(xiàn)在大家知道,從20世紀(jì)末開始到本世紀(jì),人們更加青睞的互聯(lián)網(wǎng)。互聯(lián)網(wǎng)最大的問題就給我們帶來了方便。大家過去查個(gè)東西很麻煩,以前我們大家知道,比如說過去國家圖書館,你去查資料挺麻煩,你要查一個(gè)國外的一個(gè)數(shù)據(jù)庫的東西,是報(bào)刊的東西,也非常麻煩,還要花很多錢,現(xiàn)在很方便。所以這是我們看到時(shí)代的變化,在這樣一個(gè)時(shí)代點(diǎn)上,它推動(dòng)了我們認(rèn)知的格局,就是你認(rèn)識(shí)世界、了解世界,你實(shí)際是變化,所以這一點(diǎn)是非常重要的。
就是我們開通了新的望遠(yuǎn)鏡,開通薩德,這個(gè)坦率說,對(duì)我們威脅還是非常大,所以這也就是我們?yōu)槭裁船F(xiàn)在更加重視這種數(shù)據(jù)的分析,比如說韓國部署了薩德,最大的一個(gè)
……(新文秘網(wǎng)http://jey722.cn省略1030字,正式會(huì)員可完整閱讀)……
賣的,價(jià)格最貴的啤酒跟尿布放得最近,這樣照顧一些人,反正我拿著方便,我也不管什么,這提高了它上漲的效應(yīng)。
所以大數(shù)據(jù)的價(jià)值重在于挖掘,而挖掘就是分析,我們不僅僅是為了數(shù)據(jù)而數(shù)據(jù),而分析就是找出它們的關(guān)聯(lián)程度,找出它們的交點(diǎn),找出它們的規(guī)律,來提高我們的洞察力。所以我們說大數(shù)據(jù)它顛覆了很多傳統(tǒng),比如說過去,我們?cè)诟鞣N研究里經(jīng)常講抽樣調(diào)查,現(xiàn)在當(dāng)然也不能完全代替,但是這個(gè)抽樣就有問題,你抽的是不是合理?是不是有代表性?你比如說現(xiàn)在經(jīng)常老百姓吐槽我們現(xiàn)在一些價(jià)格的調(diào)整,說搞了聽證會(huì),說聽證會(huì)上選的代表,一致都同意漲價(jià),網(wǎng)民都吐槽,說你們這一點(diǎn)代表都沒有。所以實(shí)際上說,就過去搞抽樣調(diào)查,也有這個(gè)問題,因?yàn)槟隳菢颖荆x擇的合理、規(guī)范,是不是標(biāo)準(zhǔn)?是不是具有代表性?但現(xiàn)在大數(shù)據(jù)我不搞抽象調(diào)查,我是搞全體的,樣本是全部,我這樣得出來的結(jié)論可能就比抽樣要準(zhǔn)確得多。
這樣一個(gè)情況下我們說大數(shù)據(jù)時(shí)代它的核心做的是洞察,洞察有以下幾個(gè)特色。一個(gè)我們可以洞察工作的重點(diǎn),這點(diǎn)國內(nèi)外都一樣,因?yàn)槊绹彩,它城市里頭也有發(fā)生丟井蓋,或者井蓋破損,結(jié)果怎么解決這問題呢?美國人也是,也是用了物聯(lián)網(wǎng)技術(shù),他把井蓋都貼上RFID標(biāo)簽,將來一旦沒有了,出事了,他自動(dòng)就警報(bào)。
另外可以洞察未來的趨勢(shì),這個(gè)也是一個(gè)很經(jīng)典的例子,2008年,谷歌就利用網(wǎng)上搜集,搜索到個(gè)人,所以它的用戶搜索的數(shù)據(jù)都跟某些看排名,說一發(fā)現(xiàn)這段時(shí)間大家都在搜流感有關(guān)的一些詞,可能發(fā)生流感,后來就準(zhǔn)確預(yù)報(bào)出來。我們國內(nèi)其實(shí)也有這個(gè)例子,2013年,百度的數(shù)據(jù)分析師就查到網(wǎng)民在國慶節(jié)前集中去查詢九寨溝的信息,到九寨怎么走?住在哪?怎么玩?當(dāng)時(shí)百度的數(shù)據(jù)分析師就給有關(guān)部門,包括四川省旅游局九寨溝送了這個(gè)報(bào)告,說今年十一可能游客有爆發(fā)性的增長,你們要特別小心。但是很遺憾,這個(gè)報(bào)告有關(guān)部門沒重視,結(jié)果就造成了什么呢?那個(gè)到九寨溝的游客太多,大家知道,進(jìn)溝是要用他們當(dāng)?shù)貙S玫能嚕嚥粔,上不去車,結(jié)果游客就發(fā)生了一些不愉快的事情,什么砸售票處、砸車,這個(gè)國際影響很不好。
大數(shù)據(jù)的洞察還體現(xiàn)在它可以洞察出管理的規(guī)律,就像前面我們說的像首爾公共車的部分,還可以洞察出我們生產(chǎn)調(diào)度管理的這種其他的缺陷。另外大數(shù)據(jù)可以用來洞察我們有生產(chǎn)管理的調(diào)度。這一點(diǎn)這個(gè)華為也是用這個(gè)解決了問題。大家知道,華為這個(gè)手機(jī)出來之后,大家很受歡迎,但是有一段時(shí)間這個(gè)手機(jī)脫銷,它其中的問題,大家知道,華為的手機(jī)它這個(gè)供應(yīng)鏈上,也是有一些關(guān)鍵的器件,靠其他的企業(yè)來提供,但是當(dāng)一些企業(yè)跟不上它這個(gè)調(diào)度的時(shí)候就會(huì)掉鏈。所以后來華為就利用大數(shù)據(jù),包括我們國家信息中心的那個(gè)大數(shù)據(jù)研究的團(tuán)隊(duì),和他們合作,對(duì)每一個(gè)供應(yīng)鏈上的ERP系統(tǒng)的數(shù)據(jù)進(jìn)行獲取,然后進(jìn)行分析,每一個(gè)環(huán)節(jié),每一個(gè)零件企業(yè)的ERP的數(shù)據(jù)把它會(huì)在一起,然后就可以看到,比如哪個(gè)企業(yè)它這個(gè)環(huán)節(jié)供不上東西,然后就及時(shí)的來提醒他加快進(jìn)度也好,或者加快進(jìn)料也好,就使得這個(gè)供應(yīng)鏈就好了。大數(shù)據(jù)作為洞察,還可以洞察客戶的需求。比如現(xiàn)在電子商務(wù),你要經(jīng)常在淘寶上買東西,他可以給你畫像,因?yàn)槟憷腺I東西,他知道你身高多少,穿多大的衣服,幾碼的鞋,你喜歡什么顏色的?另外還可以洞察你的員工的表現(xiàn),可以洞察你客戶的
誠信,你可以洞察合適的人選等等。
所以大數(shù)據(jù)成為當(dāng)今新的一個(gè)數(shù)據(jù)采集的手段,比如說可以用于在打擊犯罪里頭分析一些犯罪嫌疑人的行為,進(jìn)行預(yù)測(cè),可以作為預(yù)防犯罪一個(gè)很重要的。你看我們現(xiàn)在的視頻的監(jiān)控信息,包括一些犯罪嫌疑人指紋的信息,掌紋的信息,甚至人臉圖像的信息,都成為我們打擊犯罪的重要手段。
(四)大數(shù)據(jù)的建立
要做好一個(gè)大數(shù)據(jù),要設(shè)計(jì)一個(gè)大型的系統(tǒng)。首先我們說這個(gè)系統(tǒng)應(yīng)該能夠存儲(chǔ)數(shù)據(jù),能夠處理數(shù)據(jù),能夠開發(fā)出相應(yīng)的應(yīng)用,然后可以把這些應(yīng)用放到一個(gè)合適的平臺(tái)上,比如說像現(xiàn)在大家更喜歡把很多應(yīng)用放在手機(jī)上。這個(gè)大家隨時(shí)都可以用,比如現(xiàn)在大家老用的像這種高德地圖、百度地圖,這種交通流量也是用的大數(shù)據(jù)。
這里不能不跟大家提到,就是目前大多數(shù)系統(tǒng)里頭都用了一個(gè)比較成熟的技術(shù),叫hadoop,這個(gè)詞大家知道一下就可以,它是目前一個(gè)開源架構(gòu)的簡(jiǎn)稱,這個(gè)基本上是由谷歌開發(fā)出來。然后把它作為一個(gè)現(xiàn)代支撐大數(shù)據(jù)應(yīng)用的一個(gè)公共平臺(tái)。
我們當(dāng)今要建設(shè)一個(gè)大數(shù)據(jù)的系統(tǒng),就要搭平臺(tái)、采數(shù)據(jù)、建模型,然后再編寫應(yīng)用,最后是以圖呈現(xiàn)的方式,是一種最好的模式。我們看到,現(xiàn)在比如說華能一些企業(yè)都給領(lǐng)導(dǎo)開發(fā)了這種大數(shù)據(jù)的這種領(lǐng)導(dǎo)的決策系統(tǒng)。像華能做的這個(gè)東西,它可以每個(gè)領(lǐng)導(dǎo)早晨一上班,就可以看到,在這個(gè)pad上或者手機(jī)智能終端上推送,他們企業(yè)昨天一天經(jīng)營所有的數(shù)據(jù),比如發(fā)了多少度電,每個(gè)電廠發(fā)了多少度電,每個(gè)電廠發(fā)這些電輸出了多少,成本是多少,其中包括這個(gè)成本是用了哪個(gè)煤礦的煤,煤價(jià)是多少,運(yùn)費(fèi)是多少?而且每天都給你分析它的效益有提升,還是有下降,所以這些是非常重要的。所以我們要建好數(shù)據(jù)采集了模型。
另外更重要的是,數(shù)據(jù)在應(yīng)用的時(shí)候要建立好數(shù)據(jù)分析的模型,一般來說,現(xiàn)在有四大的模型,就是分類的模型、聚類的模型、預(yù)測(cè)的模型和關(guān)聯(lián)的模型。建這些模型需要有很多基礎(chǔ)必須要有的知識(shí),同時(shí)要采用一些經(jīng)典算法,我這里不展開給大家介紹。通過建好模型做好分析,提供我們這種決策樹,來為各級(jí)領(lǐng)導(dǎo)做決策提供這種輔助的支持。
最后我們剛才說的這個(gè)環(huán)節(jié),一圖勝千言,大家比較習(xí)慣還是愿意看這種圖。這個(gè)圖能夠很生動(dòng) ……(未完,全文共12158字,當(dāng)前僅顯示2892字,請(qǐng)閱讀下面提示信息。
收藏《干部學(xué)習(xí)講稿:大數(shù)據(jù)在醫(yī)療領(lǐng)域的應(yīng)用(下)》)