贝博体育app|手机版

034-19304403

在线客服| 微信关注
当前位置: 首页 > 后期工艺 > 折页海报

谷歌GFT频繁呼吁狼来了:流感大数据的狂想曲用AI预测传染病-手机版


本文摘要:谷歌GFT频繁呼吁狼来了:流感大数据的狂想曲用AI预测传染病似乎不是Bluedot的专利,但2008年,今天的AI强手谷歌曾经展开过顺利的尝试。BlueDot仍然用于自然语言处理(NLP)和机械学习(ML)训练这个疾病自动监视平台,不仅可以识别和回避数据中的噪音,还可以识别蒙古炭蛆的疾病越来越激烈,意味着1981年正式成立的重金属乐队会。

不知道预测,还是人类憧憬的能力。最近,中国人知道的周易八卦,唐代神父写的《推背图》,以及西方人知道的占星术,中世纪流行的塔罗牌,接近当时的2012年世界末日的玛雅应验的影响下经常出现的全国人民的疯狂和商业派对,记忆犹新。现在不问苍生问鬼神的时代已经过去,我们对物理世界和社会经济的确定性、经验性、概率性的预测已经成为轻型汽车的熟路。但是,比如蝴蝶效应所述的高度简单、超多变量、超大数据量的预测,人类无能为力吗?答案不是。

最近,中国武汉新型冠状病毒流行越来越激烈,引起了世界卫生组织和世界许多卫生机构的关注。其中,《连线》杂志报道了《某加拿大公司BlueDot通过AI监测平台首次预测和发布武汉经常发生疫情》的消息,受到国内媒体的关注。

这可能是我们在预测未来方面最想看到的成果——利用大数据溶解基础和AI的推测,人类可能需要推敲天意,说明了原本隐藏在混乱中的因果规律,在天灾复活前恢复世界。今天,我们从传染病的预测到达,考虑AI是如何一步一步地南北神机妙计的。谷歌GFT频繁呼吁狼来了:流感大数据的狂想曲用AI预测传染病似乎不是Bluedot的专利,但2008年,今天的AI强手谷歌曾经展开过顺利的尝试。

2008年谷歌发售了预测流感流行趋势的系统谷歌Flutrends(谷歌流感趋势,以下全称GFT)。GFT一战崭露头角是2009年美国H1N1日益激烈的几周前,谷歌工程师在《Nature》杂志上公开发表论文,通过谷歌积累的大规模搜索数据,顺利预测H1N1在全美范围内的传播。关于流感的发展趋势和地区分析,谷歌以数十亿条搜索记录处理了4亿5千万个不同的数字模型,结构流感预测指数,结果与美国疾病控制和预防中心(CDC)的官方数据相关性达到了97%,但比CDC提前了整整两周。

在瘟疫面前,时间是生命,速度是财富,如果GFT能够维持这种预见能力,整个社会似乎能够提前控制瘟疫。但是,应验神话还没有持续多久。

2014年,GFT再次受到媒体的关注,但这次结果表现得很差。研究人员2014年在《Science》杂志上发表了《谷歌流感寓言:大数据分析的陷阱》一文,认为2009年GFT无法预测非季节性流感A-H1N1。

从2011年8月到2013年8月的108周,GFT在100周内低于CDC报告的流感发病率。你低估了多少?2011-2012季度,GFT预测的发病率是CDC报告值的1.5倍以上,到2012-2013季度,GFT预测流感的发病率是CDC报告值的2倍以上。(图表来自TheParableofGoogleFlu:TrapsinBigDatanalysist|Tcience,2014)尽管GFT在2013年调整了算法,但据说经常出现偏差的原因是媒体对GFT的大幅度报道,GFT预测的2013-2014季度的流感发病率仍然低于CDC报告值的1.3倍。此外,研究人员前面发现的系统误差仍然不存在,也就是说,狼来了的错误仍然存在。

GFT泄露了什么因素,使这个预测系统陷入困境?根据研究人员的分析,GFT的大数据分析经常出现这么大的系统误差,其收集特征和评价方法可能不存在以下问题。一、大数据刻薄(BigData下Hubris)所谓大数据刻薄,是谷歌工程师提出的前提,用户搜索关键词获得的大数据包括流感疾病的全数据收集,几乎可以代替传统数据收集(采样统计数据),而不是补充。也就是说,GFT指出收集的用户搜索信息的数据与某流感流行相关的人的整体几乎有关。

这个顽固的前提是,无视数据量的大小并不意味着数据的全面性和正确性,因此2009年顺利预测的数据库样本不能包含几年后经常出现的新的数据特征。因为这个轻视,GFT可能没有考虑引进专业的健康医疗数据和专家经验,也可能没有去除和去除噪音用户的搜索数据,之后流行病发病率的评价过低,但是无法解决的问题。二、搜索引擎进化的同时,搜索引擎的模式也不一样。谷歌在2011年以后发售了推荐与搜索词有关,也就是我们今天熟悉的搜索关联词模式。

例如,对于流感检索词,获得了寻求流感化疗的list,2012年以后也获得了临床用语的推荐。研究人员分析,这些调整可能人为地提高了搜索,谷歌低估了流行发病率。

谷歌

举个例子,当用户搜索喉咙痛时,谷歌不会在推荐关键词中得出喉咙痛和感冒、如何化疗喉咙痛等推荐。此时,用户可能会因奇怪等原因展开页面,导致用户使用的关键词不是用户的原意,从而影响GFT收集数据的准确性。用户的搜索不道德反而不会影响GFT的预测结果。

例如,媒体对流感流行的报道不会减少与流感有关的词汇的搜索次数,也不会影响GFT的预测。这就像量子力学家海森堡认为,在量子力学中不存在的测量不允许原理的说明中,测量即干预在媒体报道和用户主观信息的搜索引擎喧闹的世界中,在某种程度上没有预测即干预的悖论。

搜索引擎用户的不道德几乎不是自的,媒体报道、社交媒体的热点、搜索引擎的推荐、大数据的推荐都影响着用户的心情,用户特定的搜索数据的集中越来越激烈。为什么GFT的预测总是很高?根据这一理论,GFT发表的疫情预测指数一旦上升,就不会立即引起媒体报道,与信息搜索有关,增强GFT的疫情识别,无论如何调整算法,都会改变不能测量的结果。三、相关因果研究者认为,GFT的根本问题是谷歌技术人员不正确检索关键词和流感传播之间有什么因果关系,只关注数据之间的统计学相关性特征。

过度尊重关系而忽视因果不会导致数据不足。例如,以流感为例,如果一段时间内词汇搜索量上升,可能是因为发售流感的电影和歌曲,不一定意味着流感越来越激烈。至今为止,尽管外部期待谷歌公开发表GFT算法,但谷歌没有自由选择公开发表。这使得许多研究人员批评这些数据是否可以重复或没有更多的商业考虑。

他们希望将搜索大数据和传统数据统计资料(小数据)融合起来,更好地理解和正确地研究人类的不道德。谷歌似乎不尊重这个意见。

最后在2015年GFT月脱机。但是,之后收集了与用户有关的搜索数据,只能获得美国疾病对策中心和一些研究机构。为什么BlueDot首次顺利预测:AI算法和人工分析的协奏曲,谷歌当时已经配置了人工智能,2014年收购了DeepMind,但仍然维持着独立的国家运营。

同时,谷歌也没有更加关注GFT,所以没有考虑将AI重新加入GFT算法模型,而是自由选择了GFT南北的安乐死。完全在同一时期,今天我们看到的BlueDot登场了。

BlueDot是由传染病专家卡姆兰·克汗(Kamran-Khan)制作的传染病自动监测系统,通过每天分析约65种语言的10万篇文章,追踪了100多种传染病越来越激烈的状况。他们试图收集这些方向性数据,了解潜在流行病越来越激烈和蔓延的线索。BlueDot仍然用于自然语言处理(NLP)和机械学习(ML)训练这个疾病自动监视平台,不仅可以识别和回避数据中的噪音,还可以识别蒙古炭蛆的疾病越来越激烈,意味着1981年正式成立的重金属乐队会。例如,GFT意味着将流感与搜索相关的用户解释为可能的流感患者,似乎经常低估与用户无关的流感精度。

这也是BlueDot区别于GFT筛选重要数据的优点。正如此次在新型冠状病毒疫情预测中,巴姆兰回应,BlueDot通过搜索外语新闻报道,动植物疾病网络和官方公告寻找疫情信息来源。

但是,这个平台算法不用于社交媒体的发表内容。因为这些数据过于杂乱,容易出现更多的噪音。

预测

关于病毒越来越激烈后的传播途径预测,BlueDot更倾向于采访世界性的机票数据,更好地找到感染病毒的居民的动向和行动时间。1月初,BlueDot也顺利预测新型冠状病毒从武汉越来越激烈后,几天内从武汉蔓延到北京、曼谷、汉城和台北。新冠状病毒越来越激烈,不是BlueDot的第一次顺利。

2016年,通过对巴西寨卡病毒对巴西寨卡病毒I模式的分析,BlueDot顺利提前6个月预测美国佛罗里达州经常出现寨卡病毒。这意味着BlueDot的AI监视能力可以预测流行病的地区蔓延到轨迹。BlueDot和谷歌GFT之间有什么区别?一、预测技术差异前主流的预测分析方法采用数据挖掘的一系列技术,其中常用的数理统计中的回归方法包括多线回归、多种回归、多因Logistic回归等方法,其本质是曲线的数值这也是GFT使用的预测算法的技术原理。

在学习机器之前,多回归分析获得了处理多种条件的有效方法,可以寻找预测数据犯规最小化、最大化数值优势的结果。但是,回归分析对历史数据无偏差预测的渴望,无法确保未来预测数据的准确性,不会导致所谓的过度数值。

根据北大国研院教授沈艳在《大数据分析的荣耀与陷阱——从谷歌流感趋势谈起》一文中分析,谷歌GFT显然不存在过度数值问题。也就是说,2009年GFT能够仔细观察到2007-2008年间所有的CDC数据,使用的训练数据和检查数据寻找最佳模型的方法参考的基准是高价值CDC数据。

因此,在2014年的Science论文中,GFT在预测2007年至2008年流感流行率时,不会破坏看起来奇怪的检索词,而会使用其他5000万的检索词去除1152个数据点。2009年以后,GFT预测的数据将面临更多不知道变量的不存在,包括其自身的预测在内,该数据也将参与系统。无论GFT如何调整,都必须面对过度的数值问题,无法防止整个系统的误差。BlueDot采用医疗、公共卫生专业知识和人工智能、大数据分析技术融合的方式,追踪预测世界上流行感染病的发展趋势,提出最佳解决方案。

BlueDot主要是利用自然语言处理和机器学习来提种监控引擎的效用。随着近年来计算能力的提高和机械学习,彻底改变了统计学预测的方法。主要是深度自学(神经网络)的应用,使用偏差传播的方法,从数据中大幅度训练、系统、自学,提供科学知识,经过系统自学,预测模型不会大幅度优化,预测精度也随着自学而改善。

模型训练前的历史数据输出是最重要的。充分丰富的特征数据是预测模型寻求训练的基础。清除的优质数据和提取合理显示的特征成为预测能否顺利的关键。二、预测模式的差异与GFT几乎将预测过程转移到大数据算法的结果方式不同,BlueDot几乎没有将预测转移到AI监测系统。

BlueDot在数据检查结束后,不会提交人工分析。这也正是GFT大数据分析的关性思维与BlueDot的专家经验型预测模式不同。AI分析的大数据是选择特定网站(医疗卫生、健康疾病新闻类)和平台(航空机票等)的信息。

AI得到的警告信息也必须与流行病学家的再分析有关,以证明是否持续了很长时间,评价这些流行信息能否在最初的时间向社会公开。当然,关于现在这些案例,BlueDot在预测疫情方面几乎没有成功。

首先,人工智能培训模式是否也不存在一些种族主义,如为了防止漏报,是否不会过度高估流行病的严重程度,因此出现在狼来了的问题上?其次,监控模式评估的数据是否有效,如BlueDot慎用于社交媒体的数据,以防止过多的噪音?幸运的是,BlueDot作为一个专业的健康服务平台,他们不会比GFT更关注监控结果的准确性。但是,专业的疫情专家是这些预测报告的最后发表者,其预测精度必须不影响平台的信用和商业价值。这也意味着BlueDot。必须面对商业利益和公共责任、信息对外开放等考验。

AI预测疫情愈演愈烈,意味着序曲……收到第一条武汉冠状病毒警示的是人工智能?媒体的这个标题显然让很多人惊讶。在世界一体化的现在,任何地方的流行病越来越激烈,在短时间内都有可能传到世界的任何角落,找到时间和警报效率成为预防流行病的关键。人工智能需要成为更好的流行预警机制,可以说是世界卫生组织(WHO)和各国公共卫生健康部门开展流行预防机制的方法。这也涉及到这些组织如何谈论人工智能获得的疫情预报结果。

未来,疫情AI预测平台必须获得疫情感染风险等级和疾病感染可能导致的经济、政治风险等级评价,协助相关部门做出更加稳健的决定。这一切,还需要时间。这些组织机构在制定迅速反应的疫情预防机制中,也应该把这个AI监视系统放在日程上。这次AI预测疫情越来越激烈,可以说是人类应对这场世界性疫情危机的明亮色彩。

期待这场人工智能参加的疫情对策之战只是这场消费战的序曲,将来应该有更多的可能性。例如,基于主要传染病原体的AI识别应用于主要传染病区和传染病季节性流行数据,建立传染病AI警报机制的AI帮助传染病越来越激烈后的医疗物资的优化配置等。

这些让我们拭目以待。


本文关键词:贝博体育app,信息,疫情,传染病,流行,预测

本文来源:贝博体育app-www.lotusforlease.com

客户案例Customer case
  • 【手机版】英超-阿扎尔破门中楣法尔考中柱 切尔西终结曼联6连胜
  • 这样的刘翔才真实可信 再伟大也是血肉之躯|贝博体育app
  • 贝博体育app-韦德:骑士今年无缘总冠军 对詹姆斯打击最大
  • “小鹰”哈比布被评为俄罗斯最大体育明星:手机版
  • 费德勒完胜纳达尔晋级印第安韦尔斯网球赛八强【贝博体育app】
  • 【贝博体育app】林书豪末节爆发砍29+5+5 湖人后来居上击退76人
  • 曝C罗与伊莲娜分手内幕原因:男方同时交往6国嫩妹(图)
  • 宁泽涛进入河南游泳队名单 知情人盼其强势回归-手机版
  • 中超进入收官轮 冠军无悬念、保级形势混乱而微妙-手机版
  • 手机版_布雷迪“超级碗”赛服神秘失踪 得州游骑兵协助调查