请选择 进入手机版 | 继续访问电脑版

搜索爱好者

 找回密码
 注册会员

QQ登录

只需一步,快速开始

查看: 990|回复: 1

奇虎360公司集团副总裁颜水成:人工智能杂谈 | 北大AI公开课实录

[复制链接]
发表于 2018-4-29 01:54:45 | 显示全部楼层 |阅读模式
北大新媒体 2018-04-28 18:47 人工智能/360/技术

4月25日,北京大学“人工智能前沿与产业趋势”第七讲。本期主讲嘉宾为奇虎360公司集团副总裁颜水成,他的授课主题为《人工智能杂谈》。

主讲嘉宾

颜水成,现任奇虎360公司集团副总裁、首席科学家及人工智能研究院院长,新加坡国立大学副教授。

自2004年起开始在计算机视觉、人工智能、多媒体等领域进行高质高量的研究工作和技术应用,目前在国际高质量期刊和会议上共发表约500篇论文,Google Scholar统计引用共30,000+次,5篇文章单篇引用超过1000次。在过去9年里,共获得30+项荣誉和奖励,其中包括IEEE Fellow和IAPR Fellow、2014,2015,2016年三次“汤森路透全球高引用学者”、“新加坡青年科学家奖”等。2017年带领团队斩获ImageNet大规模视觉识别挑战赛冠军。

以下为颜水成分享实录整理:

人工智能——理想与现实

自动驾驶之梦存在现实与理想的差异,太多公司过于乐观 技术或还没达到水平。情感机器人之梦仍然与搜索引擎技术比较相关 ,技术并没有达到真正的理解情感



人工智能的三个状态

初创时,专注单一产品,着重某一领域

百亿美金级时,全方位支持公司多种类型的业务和创新,着重多维度。

千亿美金级时,每个事业群有各自的有侧重点的人工智能团队。



人工智能的两类问题

Soft-tasks,如:搜索、推荐,任何新的进展都会带来很及时的效益;

Hard-tasks,如:监控、自动驾驶,必须达到一个特定阈值才能商业化。



人工智能的四元分析

场景 算法 算力 数据



学术界的人工智能

针对特定问题,探索新算法,追逐精度极限;

更好更快更大的模型结构,更多模型,甚至模型融合;

预测学习/Baby-learning/增强学习;

更好的经验参数;

更便捷的训练平台;

更多的计算资源。



学业界的人工智能是一种技术

工业界的人工智能本身不是产品,只有和具体业务/场景结合才能有价值

其中AI硬件化、后台服务系统、训练系统架构、核心算法、产品工程化、产品外观设计、产品市场营销等环节需要协作,算法总是不完美的,只有需要协作才能带来和谐。

人工智能模型+业务/场景(模型+数据)

技术的不完美可以通过用户体验弥补,例如:从换脸(较难)到在脸上增加修饰(类似兔耳朵)就会容易很多。

在产品推广时要考虑这些因素:

产品是否能满足人的刚需、技术要成熟、是否要有技术壁垒、商业变现





人工智能研发的目标:

精度极限(数据+场景固定条件下,算法+算力综合产生的精度极限)

由于场景、算力、算法、数据,不少成果无法直接变现,但可以从数据、算法、场景进行迭代,如:陪护机器人

在学术界应不断加强精度极限、进行算法创新,而在工业界更看重迭代的提升。在这个过程中不断提炼核心问题启发深入研究,并且不断用前沿成果激发新颖产品设计。在这样双目标的作用下,大公司组建自己的AI lab。

深度学习——模型与应用









Shallow learning vs Deep Learning

深度学习、特征学习和分类器学习,神经元 是一个复杂的结构。



通过Adversarial Loss约束生成图像真实性

通过约束生成图像的条件满足性

通过约束生成图像与输入图像的相关性

通过多库联合训练方法提升图像生成质量



人脸检测

对于任意一副给定的图像,采用一定的策略对其进行搜索,以确定其中是否含有人脸。在数据提升的过程中,识别争取的量级也在提升。



将图像“翻译”成自然语言(image captioning)

根据一张图片,只能得到正确的废话,但对理解图像和搜索比较有限。



深度学习应用:语音交互





深度学习应用:大数据

大数据金融 信贷

风险控制、反欺诈、信用评分

典型公司:宜信



自学习(learning from invariances)

任何系统都不是完美的,期望能够通过自学习进行提升。数据来源 广泛样本,如:年龄识别。

360的AI:研发与应用



360人工智能布局主要分为泛安全智能、短视频智能和大数据智能三类。





短视频智能>端上智能:高效能AR特效套件

端上智能:人脸特效、抠图特效、美颜特效、手势特效。

一个公式的领先一般只能持续三个月到六个月,否则很容易被其他的模仿。

短视频智能>视频云脑:海量视频管理,精细内容分析





大数据智能

基于大数据+深度学习的排序、推荐、预测算法模型。通过人工智能对广告推荐进行修正,可以对广告变现的效果提升10个百分点。

人工智能AI vs. 安全



人工智能的安全包括很多方面,其中有:智能体的安全问题、AI 传感器/数据安全、AI 软件安全、智能硬件安全。

举一些例子来说

传感器攻击

如:使用激光笔照射摄像头,会使摄像头致盲,导致识别错误。

自动驾驶

如:无激光雷达的自动驾驶汽车,一旦识别出其他投影仪投出的斑马线,会导致传感器识别失败。

人工智能产业杂谈

AI+区块链

Ocean 数据使用 可以获得return

目标市场:数据交易与共享

商业模式:利用区块链进行数据共享和交换

Cortex

目标市场:在线inference

商业模式:分布式运行用户上传模型

Raven Protocol

目标市场:分布式训练

商业模式:利用闲置资源进行分布式计算

AI+区块链 高速运转 + ICO运转

Q

A

&
 楼主| 发表于 2018-4-29 01:55:02 | 显示全部楼层
雷鸣对话陈云霁

AI+视频,静态图像到视频,技术上未来几年会有哪些突破?

战斗中寻找战斗的方法,目前的问题是数据可以获得更多,这与图像不同,但是通过搜索引擎可以获得很多。目前的问题有标注对象不知道,标注代价很高,我们应该根据效果来看技术。类似目前的互联网公司,国家建立database,所有人都有可以攻克的能力,技术进步就有新可能。技术的核心(图像部分),图像语义融合等过程的方案。模型会是推动视频人工智能的关键点。方法论是可以降低计算的复杂度的很好方法。

视频内容多,如何管理、搜索?移动中如何实时捕捉、识别人脸,人群意图?

核心技术包括人脸分析、pose行为分析……利用端上智能,将人脸分析和行为分析做好,再运送到端。这其中包括常见的动物、会动的物体,对数据标注的考量。

AR设备的发展?AR的未来发展会以什么形态和什么步伐?

微软AR是目前能体验到的最好产品,AR眼镜有必然性,手机已经迭代到几乎天花板,需要有替代的产品出现,手机的最大屏障是需要手拿,交互对话的时候不方便。问题的解决到眼镜。从电脑到手机到眼镜,这是场景的扩宽,这种发展也具有必然性。

从公司的角度和商业的角度来看,现实和理想还是有问题,光学系统、电池、内容生产这些方法均有限制。未来的发展形式可能是从一条线的形式开始慢慢迭代。

从用户来讲,最大的问题是设备的问题,AR眼镜过重并且会使人感到眩晕,这些限制均应得到突破。未来的发展应极大程度提高体验,使真实感得到极大加强。但是当前还有硬件的问题需要解决。

从科研到工业,有哪些感觉,科研上的管理到业界的研发管理有哪些不同?

学术界和工业界对AI研究是不同的,差异有,学术界在模型的基层设计,更多注意效果怎样得到更好,设计新的模型,纯粹的精度往速度拓展等。而学术界到工业界,可能开始的时候,你其实不能帮公司解决所有的问题,研究者最先最好从公司的一个场景出发,结合这个场景从数据、算法等出发,到工业界的从心来感受。AI创造力提升模型的精度,远远根本不上场景转变的速度。数据和算法同样重要。

如果说效果不够好,加数据还是改模型?

尽可能加数据,google发表的论文,模型的结果和数据量的关系,得到一个对数的线性关系。互联网的各类数据随之时间的推移是一个高度爆发的数倍爆炸式增长。算法维度也并非不重要,算法的变革也需要图形。

从科研到产业,对于学术来说,有哪些建议?怎么去花时间、积累经验?

沉下心来认认真真产生较为深度的研究,不要只为了成为4000篇文章中的普通的一篇,量不是很重要,要注重质量,成为有价值的研究者。
您需要登录后才可以回帖 登录 | 注册会员

本版积分规则

Archiver|手机版|大川乒乓网|中文搜索引擎指南网(搜网) ( 鲁ICP备16006309号

GMT+8, 2018-8-14 16:20 , Processed in 0.176379 second(s), 28 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表