成人午夜又粗又硬又长_鲁一鲁AV2019在线_欧美深深色噜噜狠狠yyy_www.91色.com_色影音先锋av资源网_特级做A爰片久久毛片A片喷水_99精品无人区乱码1区2区3区_国产人妻久久精品一区_欧美午夜精品久久久久久浪潮_av免费无码天堂在线_蜜桃色欲AV久久无码精品软件_日美一级毛片_久久久久久久久性潮_国产乱对白精彩_日韩精品免费一区二区_亚洲欧美精品在线_无码国产69精品久久久久_开心五月综合激情综合五月_干一夜综合_亚洲中文有码字幕日本

當前位置: 首頁 > 新聞 > 國內新聞
國內新聞
百度的野心:疾病數據譜
發布時間: 2014-08-07     來源: 生物探索

    6月末,借助最新大數據技術,繼城市預測、景點預測、高考預測和世界杯預測之后,百度推出疾病預測,將大數據的“觸角”向醫療領域延伸。對此,記者采訪了百度的相關負責人,并獲得百度的獨家回復。

百度的野心:疾病數據譜

    百度預測的新功能“疾病預測”,基于大數據積累和智能分析,能夠為用戶提供流感、肝炎、肺結核和性病這四種傳染病的趨勢預測,幫助用戶提早進行預防。

    據了解,中國疾病預防控制中心也為該產品提供了相關疾病監測數據。

    此外,百度疾病預測的預測范圍也不僅僅局限于大城市,而是覆蓋到了區縣和商圈。在數據模型方面,其針對每個城市分別建模,擴大數據基礎和精準性來保證預測的準確性。

    目前,不少業內人士對這樣的大數據預測疾病心里也沒有底,“我覺得這個可信度大概可以打70分吧”東軟望海科技有限公司總裁焦桐如是對記者說。在他看來,目前大數據監測及分析尚未完全成熟,在分析建模上還有一定的發展空間。但是他也毫不掩飾大數據預測疾病的前景,“這應該是一個必然的趨勢”。

    衛生經濟學家陳茁對媒體說,他對大數據預測疾病持樂觀態度,“如果方法得當,大數據對疾病預測依舊有巨大的潛能,還可以在疾病監測防控之外發揮難以比擬的作用。”

    而大數據時代下的今天,大數據對疾病監測的準確性到底如何,目前誰也不清楚。還是需要百度“疾病預測”的親身檢驗。

    什么是百度疾病預測?

    “流行病的發生和傳播有一定的規律性,與氣溫變化、環境指數、人口流動等因素密切相關。每天網民在百度搜索大量流行病相關信息,匯聚起來就有了統計規律,經過一段時間的積累,可以形成一個個預測模型,預測未來疾病的活躍指數。”對于預測原理,百度相關負責人如此闡釋道。

    目前,百度疾病預測可提供流感、肝炎、肺結核和性病四種疾病的預測,并可對過去30天及未來七天的疾病變化作出預判。“活躍度”用來反映所選地域該疾病的活躍程度,同時也可通過1~99999的活躍指數反映。用戶可以看到全國或者省某疾病指數排名前十的城市、區縣,以及該疾病相關醫院的搜索排行。

    “對于百度疾病預測這樣針對全國范圍的產品來說,可靠性、準確性是我們非常重視的。因此,我們會從統計的角度來驗證數據的正確性,以機器提供的數據為基礎,加入對異常數據的監控和分析,以確保數據的可靠性。”

    根據北京大學市場與媒介研究中心發布的2014年4月《搜索市場研究報告》中的數據,百度以市場份額82.7%在桌面端保持強勢領先地位。

    Google流感預測的“升級版”?

    因為功能相近,百度疾病預測一經推出,便令人聯想到早在2008年推出的Google流感趨勢預測(GoogleFluTrends,簡稱“GFT”)。

    當年在H1N1爆發幾周前,Google的工程師們在《Nature》上發表論文介紹GFT,并成功預測了H1N1在全美范圍的傳播,令世界為之一振。然而,在此之后,有研究發現,GFT會高估與流感相關的就醫量,在這類數據最有用的流感季節高峰期尤其預測不準確,被《Scientists》雜志認為被大數據浮夸(BigDataHubris)的算法所誤導。也就是說,Google的流感疾病預測不再那么精準。

    相較于GFT,百度疾病預測已經覆蓋提供全國331個地級市,2870個區縣,某些城市甚至已經細化到具體的商圈,“未來甚至可以更加細化到個人粒度”,百度相關負責人表示。此外,GFT目前提供了流感和登革熱的預測,而百度的疾病預測系統涵蓋流感、肝炎、肺結核和性病四種疾病。而據其網站說明,未來還會增加更多的常見傳染病和慢性病。

    談及百度疾病預測的產品形態和Google的差異。百度相關負責人補充,Google主要使用query數據,在此基礎上,百度增加了微博、天氣、人群遷徙等數據一并加入預測因素。“此外,Google用的query數據依賴于GoogleCorrelation產品,而百度則是直接從原始日志中進行清洗、消岐、擴展和分析,在數據上做得更細致些,也由此可以提供更加有效的判斷。”

    不只是“一堆數據”

    在百度疾病預測的介紹版塊中,特別向中國疾病預防控制中心(以下簡稱CDC)表示了感謝。“在構建流感預測模型的過程中,中國疾病預防控制中心的流感監測結果提供了一定的參考作用。”

    實際上,百度疾病預測參考了CDC2006年1月至2014年6月的流感監測周報數據,并且會根據CDC公布的數據定期來更新。

    “百度的結果算法在模型搭建上是綜合參考多維度數據結構,其中我們在與CDC數據合作上,不僅是數據互通,同時也會與他們的專家進行產品交流,最終的預測結果主要還是依靠我們所建立的疾病預測模型來完成。”百度相關負責人表示,疾病預測的模型數據搭建于疾病人數自身的統計規律性以及疾病人數與其它相關數據的相關性。

    一方面,通過歷史數據挖掘規律來預測未來的趨勢,譬如流感或者手足口等疾病具有季節性周期規律,或者近年來艾滋病整體上具有一個上升趨勢等;另一方面,數據之間存在相關關系,這也會對未來疾病趨勢有所影響。“比如搜‘感冒藥’、‘三九感冒靈’詞的次數與感冒人數之間就具有較強的相關性,在微博上提到手足口病的次數與手足口病蔓延程度有一定的相關性,異常的天氣變化與感冒人數也有一定的相關性等。”百度相關負責人解釋,“我們會通過分析百度的搜索query、微博內容、天氣變化、人群遷徙等數據與疾病人數的相關性,建立機器學習模型,利用這些數據來預測疾病的人數。

    大數據如何落地?

    事實上,百度的“野心”遠不止簡單的疾病預測,讓“大數據落地”是如今互聯網公司不得不做出的改進,而百度也將在醫療領域深化定制化的健康信息服務。

    為了讓疾病預測不只是一堆數據的堆積,而成為“中國人的健康圖譜,老百姓實用的生活助手”,百度正在對此產品進行優化,希望繼續增加病種,以覆蓋常見傳染病和慢性病。

    此外,“除了時空數據,我們還會增加天氣、環境污染、用戶屬性數據,希望能夠針對不同用戶,提供個性化的防病、健康信息推送。”百度相關負責人透漏,百度疾病預測還將提供每日疾病指數等細化數據,日后有望增加個人健康顧問、預防治療措施、求醫用藥指導等功能。

代理服務
主站蜘蛛池模板: 穆棱市| 长宁区| 望城县| 美姑县| 中江县| 三台县| 普宁市| 公安县| 泰兴市| 巴林左旗| 五台县| 区。| 孟连| 彝良县| 邛崃市| 虹口区| 延庆县| 罗江县| 涟水县| 昭苏县| 梅州市| 丹东市| 华坪县| 玉山县| 阿坝| 常德市| 伊金霍洛旗| 新民市| 宁南县| 土默特右旗| 临泽县| 高青县| 碌曲县| 即墨市| 武定县| 包头市| 东源县| 高雄市| 南京市| 咸丰县| 噶尔县|