请选择 进入手机版 | 继续访问电脑版

北南南北论坛

 找回密码
 立即注册
查看: 20|回复: 1

移民李飞飞

[复制链接]

549

主题

929

帖子

2630

积分

金牌会员

Rank: 6Rank: 6

积分
2630
发表于 2017-12-28 09:17:13 | 显示全部楼层 |阅读模式
本帖最后由 vxbus 于 2017-12-28 09:20 编辑

lifeifei.png
本文转自“腾讯深网(ID:qqshenwang)”,作者:略大参考,原文标题:《移民李飞飞》。

“AI没有国界,AI的福祉也没有国界。”在12月中旬上海的一个演讲中,李飞飞这样说。

她自己就是那个技术和知识没有国界最好的证明——出生于中国,16岁和父母移民到美国,全家人靠洗盘子、开干洗店生存下来,凭借强大的驱动力,她在普林斯顿、加州理工这些学校里完成了世界最好的科学训练。

之后,她一头扎进了人工智能的研究中。

整个人工智能研究领域,尤其是计算机视觉研究,因为她的贡献而变得不同。2016年,美国最古老的基金会——卡内基基金会,提名她为当年的杰出移民。

但她在学科上做的贡献、她培养的门徒从来没有限制在美国境内。现在,她又作为谷歌的一员回到中国,领导这家公司在中国的人工智能研究中心。

知识和技术总是流动的,不会因为行政命令或者是特朗普签证关卡而停止流动。




李飞飞谈及自己的人生,总是从16岁谈起,她说那年她和父母移民到了美国。

她1976年出生在北京,16岁那年是1992年。

那大概是中美经济生活之间还存在巨大差距的最后一个时代,从中国移民到美国往往要付出巨大的代价。李飞飞全家移民到美国两年后,一部名为《北京人在纽约》的电视剧在国内爆红,描写的就是这种代价——社会地位的落差,经济上的困顿等等。

李飞飞受过高等教育的父母来到美国后,也失去了原本在中国的知识分子的工作,父亲给人修理照相机,母亲则是一名收银员。

用她自己话来说,全家人处于一种“求生模式”中。李飞飞说,她什么样的工作都做过,从在中餐馆里打工,到给人打扫房子甚至帮人遛狗,但她没有觉得困难,因为父母也同样努力工作。

初到美国,全家人住在纽约附近一个叫帕西帕尼(Parsippany)的地方,全家人仅有的一些朋友都是和他们一样的移民,“大家都很忙,忙着讨生活”。

作为一个移民,她必须从零开始学英语。相比当地的孩子,她浑身散发着书呆子气,她说她在学校也没有太多的朋友。

“我想要理解很多本质的问题,如宇宙的起源,生命的意义等,我想要生命中拥有那种智慧。”她说这是她的驱动力。

所幸她的数学和理科都不错,她就读的帕西帕尼高中(Parsippany High School)在新泽西州的高中里排名中等,她毕业的时候排名第六。

当时她申请了一大批学校,但普林斯顿给了几乎全奖的奖学金,她去了普林斯顿。

事实上,她考上普林斯顿就在当地让人惊讶了,1995年2月,当地的报纸专门刊载了她的故事,《“美国梦”成真了!》

她最大的欣喜是发现身边朋友起了变化,“身边全是这些学术、知性、充满魅力的人”,她说。

她极少公开提及的是她与《南京大屠杀》的作者张纯如在那段时间成了好友。她在普林斯顿读书时,曾经举行过一个跟南京大屠杀有关的活动,当时在地区有不小的影响力,作为学校里数量非常非常少的来自中国大陆的学生,做到这一点并不容易。

在她与知识分子为伍时,她家人的生活还在挣扎当中,她决定在帕西帕尼盘下一家干洗店来,让父母来经营。全家人都凑不够那么多钱,她四处向朋友借钱,甚至从高中数学老师那里借到了钱。

多年后回忆起初到美国的困顿生活,她总是提及她的高中老师,“我真的很感谢那些高中老师们,我当时什么都不是,就是个移民的小孩”,她回忆说,但这些白人老师愿意帮助她。

她自己说那就是“双城记”,帕西帕尼和普林斯顿。

周一到周五,她在普林斯顿学物理,放学后通过电话参与干洗店的经营,周末她就回到帕西帕尼给家里的干洗店帮忙,接待那些来取送衣物干洗的人。“我非常爱普林斯顿,不过也非常爱我的洗衣店,缺少了它们中的任何一件,都没有现在的我”,她说。



1999年,她从普林斯顿毕业。作为一个和父母一路艰辛走来的中国移民女儿,这毫无疑问是一个帮助全家人从经济困境中解脱出来的最佳时刻。

当时是美股大牛市,就业市场一片大好。她受邀去面试了数家投行和咨询公司,高盛和麦肯锡都给过她工作offer。如果她就这样去了华尔街,从此让全家人过上了富裕的中产生活,也是一个足够励志的北京人在纽约的故事了。

她并没有去华尔街,而是选择了去西藏研究一年藏药,“这听起来很疯狂”,李飞飞说她自己也知道一般人难以理解她的选择。

她的父母放弃了北京知识分子生活来到美国,也并不只是为了早日过上美国舒适的生活,他们非常尊重李飞飞的选择。

从西藏回来后,她选择继续读博,学的是人工智能和计算神经科学。这意味着这段时间她还是只有微薄的奖学金,全家人仍然要承受经济的不宽裕。

“人生最大的挑战其实是不辜负你最大的潜能,又不辜负你身上的责任,以及诚实面对你自己内心所希望追求的事业”,2017年,她在接受CNN采访时这样说。

在加州理工读博士期间,李飞飞妈妈得了癌症,又患了中风。

在《北京人在纽约》那部电视剧里,生活里的困苦拍成了40集连续剧,李飞飞在接受CNN采访时把这段经历间断地描述为,”我们经历了很多艰难困苦,然后一起挺过来了。”她说,如果加州理工那段经历发生在她刚刚来美国那段时间——要面临全新文化和语言的挑战,她不认为她自己能够办得到。

2005年,李飞飞从加州理工获得了博士学位。

从1995年到2005年,她接受了世界上最好的科学教育。


回复

使用道具 举报

549

主题

929

帖子

2630

积分

金牌会员

Rank: 6Rank: 6

积分
2630
 楼主| 发表于 2017-12-28 09:17:53 | 显示全部楼层



从移民生活的困顿中解脱了出来后,李飞飞一头扎进关于大的问题的研究当中——如何让计算机理解图片。

计算机如果要越来越广泛地被人们所使用,就必须习得认知画面的能力。最简单的例子是,当自动驾驶的汽车前方路面出现了一个障碍物时,计算机需要识别那是个可以轻松碾过去的纸袋子还是个应该避开的石头。

这是认知世界最重要的一部分能力。大自然努力了5亿4千万年,人类才进化到拥有这个地步。几十年来,相当一部分计算机研究人员都投身于此。

2005年前后,李飞飞刚成为美国伊利诺伊大学香槟分校的计算机科学教授。对于计算机的图片识别问题,她发现学术界和AI工业界都在朝着一个方向努力:寻找一个更好的算法,这个算法可以提供更好的决策。

但她看到到了这个路径的局限性——如果这种算法基于的数据并不能够反映真实世界,再好的算法也不会有用。她试图寻找另一种路径——构建一个更好的数据集。

在保持对这个问题的思索中时,李飞飞恰巧接触到了关于WordNet的理论,受到了启发。

1980年代,普林斯顿大学物理学家乔治·米勒启动了一个项目叫做“WordNet”,目标是为英语语言搭建一种逻辑结构——有点像词典,但不是按照字母排列,而是以逻辑关系展现,这种逻辑关系能够被机器理解和阅读。

比如,“dog”(狗)这个词会出现在“canine”(犬)这个词下,而“canine”(犬)又出现在“mammal”(哺乳动物)这个词下。以这种方式,WordNet收集了15万5千多个索引词汇。

2006年,访问母校普林斯顿时,李飞飞拜访了在WordNet领域有影响力的一名学者Chrinstiane Fellbaum教授。Fellbaum给她出了个主意,建议她给WordNet每个单词配一张图片,作为一种逻辑关系的索引。

几个月之后,她回到普林斯顿任教,再几个月后,2007年初,李飞飞启动了ImageNet项目——遵循了Fellbaum的建议,给每个单词配以多个图片,从而构建一个庞大的数据集。

十年后的2017年,她在接受Quartz 采访时回忆那段经历,“那时我们决定做一些史无前例的事情,要描绘整个物理世界。”

李飞飞说的“我们”不过是包括她自己在内的三个人——她聘请了教授研究员Kai Li,Kai后来又说服了博士研究生Jia Deng加入,而Deng一直和李飞飞一起管理这个项目,一直到2017年这个项目结束。

“当时我清楚地知道这将改变视觉研究领域的游戏规则,但如何改变,却不清楚。”Jia Deng对Quartz回忆说。

ImageNet 数据集里既包括熊猫、教堂这种具体事物,也包括“爱”这种抽象概念。

他们这个庞大的工程,要从最基础的工作开始——给WordNet这种逻辑数据集添加照片。

李飞飞的第一个想法就是以10美元每小时的价钱雇佣本科生,让他们以人工的方式寻找照片并添加进数据集。很快,他们发现,按照这种速度,大约需要90年才能完成照片收集。

叫停这个方案后,李飞飞和团队重新回到黑板前来讨论别的路径。他们考虑写一些算法,让计算机自己从网上找图片,然后只是人工审核准确性。又对算法推敲了几个月,他们发现这种路径缺乏持续性——这种算法只能拣出能够识别的图片,而这种识别能力在编程时就限定了的。

李飞飞的目标始终是整个世界。

与此同时,李飞飞还面临的另一个问题是团队已经没有资金了。她四处向联邦申请资金,得到的回复是对方写在申请书上严厉的批评——为普林斯顿在做这样的研究而感到羞愧,这个研究唯一的可取之处是这是一个女性主导的研究。

没有任何一家愿意给他们钱,这个项目眼看陷入绝境。

转机来自于李飞飞和一个研究生偶然间的聊天。那名学生问李飞飞是否知道亚马逊的 Mechanical Turk 网站——一个众包平台,可以把任务在这个平台上分发出去,雇佣世界各地的人用电脑远程完成,费用低廉。

“我真的就是在当天对ImageNet重新燃起了信心”,李飞飞说,“突然间就找到了一种可以大规模完成这个任务的工具,如果仅仅是靠普林斯顿的本科生,ImageNet将是一个不可能实现的梦。”

即便利用 Mechanical Turk 这种高效的工具,数据集最终也花费了两年半的时间才完成。最终它包含了 320 万张标记的照片,这些照片被划分为 5247 个种类,划分为12个子树,比如“哺乳动物”“机车”和“家具”等。

2009年,李飞飞和团队发布了ImageNet的论文和数据集,但并不是什么破茧而出的时刻,外界几乎没有什么反应。

当时在CVPR——计算机视觉研究的前沿会议上,主办方都不允许他们上台做演讲,仅仅是批准他们贴一张海报。没有办法,他们只好向与会人员派发印有Imagenet品牌的钢笔。

他们所有的努力都是基于这样一种观点——更多地数据对于算法是有帮助的,但大部分人对这个观点持怀疑态度。

Jia Deng对当时的遭遇记忆犹新,“很多人都说,如果你连一个物体都算不好,干嘛要收集几千几万个物体的数据?”

李飞飞始终是一个有野心的人,她希望更多的人接受她的观点,“我们意识到如果要更大众接受这个路径,那我们要做得更多。”李飞飞说。

在图片识别研究领域会有一些赛事,大家持自己算法参赛,对同样的图片数据库做识别,识别率最高者获胜。李飞飞联系到了当时欧洲的一个知名的图片识别大赛PASCAL VOC,对方同意和她联名举办比赛。
随着比赛不断举办,ImageNet的名声越来越大,成为衡量图像识别算法性能如何的一个基准。

随着比赛举办到2011年、2012年,研究者们注意到比赛之外的收获——他们的算法经过使用 ImageNet 数据集后表现得更好了。李飞飞向外界证明了他们观点的正确性——更多的数据对于获得更好的算法是有用的。

Alex Berg,团队的第四名成员后来回忆说,“人们惊讶地发现先用 ImageNet 训练模型,然后再针对其它任务调试模型,这不仅仅是神经网络领域的突破,也是识别领域的重大进展。”

2012年的ImageNet大赛上,发生了一件重要的事情——杰弗·瑞·辛顿(Jeoffrey Hinton)和他的团队胜出。

那场大赛上,来自加拿大多伦多大学的杰弗瑞·辛顿(Geoffrey Hinton)、Ilya Sutskever,和 Alex Krizhevsky 提交了一个叫做 Alexnet 的深度卷积神经网络架构,夺得了当年的 ImageNet 冠军,图片识别的正确率比第二名高出达41%。

一直到今天,人们都把深度学习能够重新获得生命的原因归结于这场比赛,从此以后整个人工智能研究领域都发生了变化。




回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


手机版|北南南北论坛  

GMT+8, 2018-1-17 19:14 , Processed in 0.073009 second(s), 33 queries .

© 2001-2016 VxWorks6 Inc.

快速回复 返回顶部 返回列表