返回栏目
首页人工智能 • 正文

年末收藏! 呉恩达棚卸2020年度AI人気事件

发布时间:  来源:河洛网

本文由雷锋网转载,必要时转载到雷锋网官网申请授权。

年末收藏! 呉恩达棚卸2020年度AI人気事件

昨天吴恩达圣诞节回顾了2020年AI的重大发展。 支持AI的新型冠状病毒大爆发、数据集存在种族偏见、对抗假信息算法、AlphaFold预测蛋白的三维结构、1750亿参数的GPT-3的出现等。

吴恩达的留言:

亲爱的朋友们,过去十年里,我每年都去新加坡和香港,和我妈妈一起庆祝她12月22日的生日。 今年我们在Zoom网上庆祝生日。 即使相隔很远,我的家人也很高兴能从美国、新加坡、香港、香港、新西兰在线聚集,演唱同步性差的&ldquo。 Happy Birthday To You” 。

我也和大家一起用Zoom通话,祝大家节日快乐,新年快乐!

假日期间,我总是想重要的人,回顾他们为我和其他人做的事,默默地感谢他们。 这使我感到与他们的联系更紧密。

我认为我们在脱离社会的假期里思考是非常值得的。 你生活中最重要的人是谁? 我有什么理由需要感谢他们吗?

无论是面对面还是在线,我希望你能找到自己的方法— — 在这个假期里培养了和最重要的人的关系。

Keep learning!

2020年回顾过去是序章

在过去的一年里,突然的传染性冠状病毒破坏了人们的正常生活,由此产生的社会裂缝也威胁着我们的共同利益。

在这一年里,有很多机器学习工程师参加,设计了新冠诊断和治疗肺炎( Covid-19 )的工具,建立了识别仇恨言论和虚假信息的模型,指出并强调了AI社区整体的偏见的存在。

但是,这一年可以把睡衣按钮换成西装的在家办公工具,GPT-3语言模型,AI辅助艺术和表演方面的魅力实验也有轻松的一面。

接下来,让我们一起探讨过去一年我们的辛苦和光辉。

应对新型冠状病毒大爆发AI加快了科学家搜索冠状病毒疫苗,世界机器学习研究者们争先恐后地利用AI技术对抗冠状病毒。 例如:

1 .巴黎和戛纳市在公共汽车站、公共汽车和市场上使用电脑视觉评价法规遵守情况。

2 .多哥政府训练AI模型识别卫星图像中的贫困地区,并将救济金正确分配给最需要的人。

聊天机器人提供了被瘟疫封锁的人们聊天和感情投入的合成虚拟朋友。

4 .视频会议公司为在线办公室提供AI模型,过滤背景噪音,使睡衣成为虚拟的商务正装。

5 .中国研究机构合作开发了可以通过CT扫描检测Covid-19的AI模型,其精度超过了90%。 该型号已经在7个国家部署,代码下载次数超过300万次。

6 .美国生物技术公司的Moderna,疫苗于12月得到美国食品药品监督管理局的批准,使用机器学习优化mRNA序列,转换成可以测试的分子。

另外,AI在Covid-19的治疗中也起着重要的作用。 例如,一个非营利组织使用半监督深度学习平台筛选了14000种抗病毒药物候选,验证了动物实验中值得期待的4种化合物。

我的立场: AI不是万能药,但这种新型、高感染性冠状病毒的诞生成为人类利用AI对抗传染病能力的有力实验。

Deepfake伪造“ 一切” 对抗网络渗透到文化、社会、科学领域时,网络中静静地充斥着无底的合成图像。

如你所见,Deepfake还出现在主流娱乐活动、商业活动、政治活动、甚至是纪录片中,用于替换当事人的真实身份以保护隐私。

最初,图像生成器在在线前端的大规模使用是在2019年之前“ This Person Does Not Exis” 的真实合成人物形象在网上广为流传,具有幽默感的程序员们开始利用生成式对抗网络( GAN )模仿现实世界的细节。

1、训练有素的Google Earth是“ This City Does Not Exist” 生成大小定居点的鸟瞰图。

2、“ This Horse Does Not Exist” 可以生成各种姿势、品种和形态的马。

3、“ This Pizza Does Not Exist” 与真正的披萨相比,可能缺乏奶酪和调味汁的光泽感。

4、生成的不存在的中国山水画欺骗了很多艺术爱好者。

论文链接: https:/ arxiv.org/PDF/2011.05552.PDF

详细信息: GAN专刊包括Deepfake检查、吴恩达对GAN发明者Lan Goodfellow的独家采访等。

https://blog.deeplearning.ai/blog/the-batch-gan-special-issue-ian-goodfellow-for-real-detecting-fakes-including-minorities-synthesizing-training-data-applying-virtual-make-up

数据集上存在种族偏见深度学习的基本数据集开始受到关注。

由于编译、标记和使用数据集的不同,在模型培训过程中对社会边缘化群体产生了偏见。 研究者的审查促进了AI的改革,同时加深了对AI隐藏的社会偏见的认识。 今年的典型案例如下。

1、有名的计算机视觉数据集ImageNet被赶在架子上。 ImageNet的创始人李飞飞及其同事重新整理了数据集,删除了WordNet词汇数据库中的种族主义、性别歧视和其他鄙视标签。

2 .一项研究表明,即使使用未标记的ImageNet数据进行训练,该模型也可能会因数据多样性不足而引起偏差。

3 .麻省理工大学的计算机科学和人工智能实验室撤回了Tiny Images数据集。 这是因为外部研究者发现这个数据库里充满了性暗示、种族歧视等许多不良标签。

用于训练StyleGAN的数据集FlickrFaces-HQ(FFHQ )也同样缺乏足够的多样性。 基于StyleGAN模型训练的PULSE算法是美国黑人总统巴拉克·为奥巴马( Barack Obama )的肖像画变成了白人。

( PULSE将低分辨率的照片转换成高分辨率的图像)

PULSE事件发生后,Facebook首席科学家Yann LeCun与当时的Google AI伦理负责人Timnit Gebru之间进行了讨论。 争论的焦点是机器学习中的社会偏见来自AI数据集还是AI系统。

LeCun的立场是模型训练“ 有偏见的数据集” 以前不存在偏见,即模型本身不存在偏见,有偏见的数据集可以修改。 Gebru说,正如我们在信中所说,这种偏见是在社会差异的背景下产生的,为了消除AI系统的偏见,必须解决整个领域的差异。 之后,在关于偏见的进一步分歧中,Gebru和谷歌走了不同的路。

我的立场:确认数据集的偏见在任务开始时被删除了。 这项重要的工作才刚刚开始。

详细信息:关于减轻过去一年的技术偏见的研究报告。

https://blog.deeplearning.ai/blog/the-batch-ais-progress-problem-recognizing-masked-faces-mapping-underwater-ecosystems-augmenting-feature

对抗虚假信息算法的全球新型冠状病毒大爆发和有争议的美国大选引起了虚假信息风暴,大型AI科技公司都受到了影响。

面对来自公众的日益压力— — 为了阻止煽动性的谎言,Facebook、Google的YouTube部门、Twitter正在争夺更新推荐引擎。 据知道纪录片中的Netflix对他们进行了严厉的斥责美国国会议员对他们展开调查的民意调查显示他们失去了大部分美国人的信任。

这些公司试图使用各种算法和策略来解决虚假的信息问题,包括

1、在发现包括AI生成的虚假头像在内的数百个用户个人资料后,Facebook严厉打击了被认为有误解的操纵媒体,彻底禁止了Deepfake视频。 该公司继续开发深入的学习工具,以检测仇恨言论,检测导致偏见的迷因和Covid-19相关的错误消息。

YouTube开发了分类器,用于识别仇恨言论、阴谋论、医学错误信息和其他恶意视频等违规内容。

3、Facebook和Twitter关闭了他们认为扰乱国家宣传活动的账户。

4、这三家公司在包含美国大选误解的情报内容上追加了免责声明。 Twitter采取最严格的政策,直接通报唐纳德·的特朗普总统的虚假推特。

但是,他们显然没有进行触底线的变更,而且其改革可能也不会持续很长时间。 因为他们的政策已经放松了,一部分已经产生了相反的效果。 例如:

今年6月,据《华尔街日报》报道,一些Facebook高管停止使用某些监管工具。 该公司随后取消了选举期间使用的修正算法。 这是因为促进了一些新闻来源的知名度。 Facebook无诚意的做法迫使一些员工辞职。

YouTube采用的算法成功地减少了假信息内容制作者的访问次数。 但是,对福布斯新闻等频繁发布同样可疑信息的大型实体的访问也在增加。

我的立场:现在在这只猫和老鼠的游戏中,没有明确的方法来赢得谣言的人和虚假的内容发布者,但猫必须在这个游戏中领先。 否则,会失去公共信任或被监管机构调查。

AlphaFold预测了蛋白质三维结构AI在医学制度上受到阻碍的减少,为深入学习在医疗器械和治疗中的广泛应用奠定了基础。

前几天,DeepMind的AlphaFold模型在短短几个小时内就确定了蛋白质的三维结构,对新药物开发的承诺和生物学洞察迅速受到关注。 我们知道医疗机构已经采取了将这种技术纳入主流医学实践的行动。

以下制度上的转变提高了医疗AI的知名度,越来越被认可。

1 .美国最大的医疗保险公司已经同意为使用机器学习设备的医生提供补偿。

2 .美国食品药品监督管理局( FDA )批准了一些新的基于AI的治疗方法和设备,如心脏超声波检查系统。

3 .跨学科国际医学专家小组介绍了Spirit和Consort两个协议。 该协议的目的是保证基于AI的临床试验遵循最佳做法,同时便于外部审查者验证和报告试验成果。

我的立场: AI在医学上的应用要求医生和医院重组工作流程,这在一定程度上延缓了AI的应用进度。 一旦FDA和医疗保障制度更加明确,临床医生就会有更大的动力来应对它。

详细信息: Deeplearning AI医疗专刊包括诊断、预防、深入学习在治疗中的应用、AI医学教父Eric Topol的独家采访。

https://blog.deeplearning.ai/blog/the-batch-ai-for-medicine-special-eric-topols-planetary-health-system-discovering-drugs-diagnosing-heart-disease-predicting-infections-alexa-for-doctors

GPT-3解锁写作新方式自然语言处理的神经网络体积越来越大,功能也越来越丰富,很有趣。 例如GPT-3对网民有50多种新的使用方法,比如画画、写代码、玩游戏等。

GPT-3是由OpenAI制作的包含1750亿参数的文本生成器,显示了自然语言处理的持续进步。 同时表现出机器学习领域的广泛趋势:模型参数呈指数增长,无监督学习成为主流,越来越普遍。

1、GPT-3的写作能力比上一代GPT-2更强,用它写博客文章和Reddit评论时,成功地欺骗了很多人类读者。 另外,也有很多人用各种各样的方法表现GPT-3的创造性,比如写哲学文章,和历史人物对话等。

图注: AI生成的哲学文章

2 .语言模型促进了商业工具的发展,如苹果自动修正功能帮助区分不同的语言。 Amazon语音助理Alexa更新了机器人律师,使其能够跟踪会话内容的切换,并对非法称呼美国市民的电话销售商提起诉讼。

3、OpenAI的GPT-2训练根据Pixel数据生成iGPT,iGPT通过部分填补模糊的内容生成奇怪的图像。

我的立场:语言模型显然越大越好,但不仅如此。 iGPT预示着用图像和文字训练的模型,至少在OpenAI的工作中可能比2020年的巨大语言模型更聪明更奇怪。

详细信息: NLP专题包括如何消除偏见和对NLP先驱Noam Shazeer的独家采访。

https://blog.deeplearning.ai/blog/the-batch-nlp-special-issue-powerful-techniques-from-amazon-apple-facebook-google-microsoft-salesforce

【编集推奨】

    相关文章Related

    返回栏目>>

    河洛网首页

    Copyright © 2019 河洛网 版权所有 dahuimr@163.com