语音识别、文本识别、视频(pín)识别……数字经济时代(dài),人工(gōng)智能技(jì)术已走近你(nǐ)我身边,被视为(wéi)经济(jì)增长的新引擎、国(guó)际竞争的新(xīn)阵地和推动智慧社会建设的有效(xiào)工(gōng)具(jù)。而加快“人(rén)工(gōng)智(zhì)能+”产业融合、赋能(néng)更多行业(yè)应用落地(dì),更成为社会各界共同的期待。
然而,不久前(qián)在由(yóu)中(zhōng)国人工智能学会(huì)主办的2020中国人工智(zhì)能产业(yè)年会上,最新(xīn)发布(bù)的报告指出,目前已(yǐ)成熟(shú)应用的人工智能技术仅(jǐn)为语音(yīn)识别,机(jī)器(qì)学习、计算机视觉(jiào)、自然语言(yán)处理、知识(shí)图谱、智(zhì)能机(jī)器人(rén)等技术距(jù)离生长成熟尚需数年时间,而无人驾驶汽车(chē)在未来10年(nián)内都不太可能出(chū)现(xiàn)。
从实验室(shì)走向大规(guī)模(mó)商用(yòng),人(rén)工智能还(hái)需要多(duō)久?尚存在哪些“堵点(diǎn)”“痛(tòng)点”?在许多业内专家(jiā)看(kàn)来,正(zhèng)视人工智能(néng)尚存(cún)在的诸(zhū)多(duō)挑战,对(duì)技术赋能抱(bào)有理性期待,方能让其回(huí)归技术本质,成为更多产业变(biàn)革创新的(de)动力源泉。
算法不透明导致的不可解(jiě)释
2016年,谷歌人工智能系统AlphaGo击败世界围(wéi)棋冠军(jun1)李世石(shí),令世人大为震动。依靠人工智(zhì)能深度学习理(lǐ)论(lùn)的(de)突破,计算机可以模仿人类作出决策,然而,这(zhè)仅(jǐn)基于(yú)大量的数据(jù)学习,而非(fēi)因果或(huò)规则推(tuī)理,整个决策过程仍是一个“黑箱”,人(rén)类难以理解,导致追责(zé)难。
复旦大(dà)学计(jì)算机(jī)科学技术学院院长(zhǎng)姜育刚(gāng)举例,此前,美国IBM公司(sī)研发了人工智能系(xì)统“沃森”帮助医生进行诊疗决策。然(rán)而,许(xǔ)多医生很快发(fā)现在使用“沃(wò)森”时,系统给出(chū)了多个不安全、不正确的治疗(liáo)意见,甚(shèn)至在(zài)极(jí)端的诊断(duàn)案例中,“沃森(sēn)”给有(yǒu)出(chū)血症状的(de)癌症病人开出了容(róng)易导致出血的药物,严重时可致(zhì)患者(zhě)死(sǐ)亡。然(rán)而(ér),医生却并不知道(dào)为(wéi)什么(me)“沃(wò)森”给出了这样的意(yì)见。决策步骤的不可解释,带(dài)来诸多不确(què)定性。
近年来,人(rén)工智能应用于(yú)新(xīn)药(yào)研发被寄(jì)予(yǔ)厚(hòu)望。然而,算法的不(bú)可解(jiě)释(shì)性(xìng)却横(héng)亘在前。相关研发和监管部门需要清楚地知道药(yào)物开发中使用的算(suàn)法,从(cóng)而(ér)理解人工智能主导的决策背后的逻辑。如(rú)果不对监管(guǎn)实现算(suàn)法透(tòu)明化,人工智(zhì)能将会是一个无法进行严(yán)谨的科学评(píng)价及验证的“黑匣子”。这可(kě)能会导致在药物审(shěn)批(pī)过(guò)程中出现种(zhǒng)种(zhǒng)无法(fǎ)预料的问题,比如对(duì)人工智能“发现”的(de)生物(wù)标记物的接受度不(bú)明。此外,对于智能政务、无人驾(jià)驶这样安全性要求极高的(de)行业,人工智(zhì)能(néng)的(de)引入自然更(gèng)为谨慎。
“深(shēn)度学习的算(suàn)法和(hé)核心模(mó)型需要(yào)能够真正展开,让公众知晓它的机理模型(xíng)”,上海人工智能研究院有限公司(sī)总经理宋海涛(tāo)建议(yì)。中科院软(ruǎn)件(jiàn)研(yán)究所(suǒ)研究员薛(xuē)云志则指出(chū),人工智(zhì)能面向不同知识背景的用户,要能以简单、清(qīng)晰的方式,对决策过程的根据和原因进行说明(míng),并能对系统决策过程关键(jiàn)节点的数据加以追溯并能(néng)够审(shěn)计(jì),这在(zài)未来(lái)人工智能应用大(dà)规模落地时(shí),是特别需要(yào)关注(zhù)的特性(xìng),也是实施监管的必要(yào)。
易受欺骗引发安全性质疑
作为(wéi)人(rén)工智能技术的“大热选手”,深度(dù)学习可以(yǐ)通过对大量已知样本的训练,制作自己的样本(běn),这是深(shēn)度学习的特点(diǎn),同样也是痛点。
京东人工智能研究院院长周伯文坦言,人工智能目(mù)前在面向产(chǎn)业化(huà)落地时,遇到的(de)巨大挑战(zhàn)正是真(zhēn)实(shí)环境的(de)开放边界和规则模糊,数据的(de)“噪音(yīn)”非常(cháng)多,使得智能模型的部分结(jié)果(guǒ)和使用情况难以让人信赖。
姜育刚指(zhǐ)出,人工(gōng)智能目前的智能判别模式存在(zài)缺(quē)陷,容易被对抗样本所(suǒ)欺骗。比如图像识别(bié),在一张人像图片上加入一些非常少量(liàng)的干扰,人为视觉看上去基本(běn)没(méi)有区别,但人工智能模型就会产生识别错误(wù);再如自动驾(jià)驶,一张(zhāng)“限速80码”的交通标牌,加入一些干(gàn)扰后,就可能被机器识别成“禁(jìn)止(zhǐ)通行”。显然,存在很(hěn)大的(de)安全隐(yǐn)患。
语(yǔ)音识别领域也存(cún)在这种问题(tí)。技术人员在语音上(shàng)任意(yì)加入非常微小的干扰,语(yǔ)音识别系(xì)统就可能会识别错误(wù)。同样,在文(wén)本识(shí)别领(lǐng)域,改变一(yī)个(gè)字母就可(kě)以使得(dé)文本(běn)内容被(bèi)错误分(fèn)类。
此外(wài),若深(shēn)度学习(xí)的数据集(jí)中存在隐藏的偏(piān)见,人工智能系(xì)统(tǒng)无法发现,也不会否定。缺少反馈(kuì)机(jī)制的“照单全收(shōu)”,最终可能导致生成的结果并不(bú)客(kè)观。
例如在行业内(nèi)已经(jīng)出现的,人工智能在深度学习(xí)后对女性、少数族裔、非主流文化群体产生“歧视”:亚马逊通过人工智(zhì)能筛(shāi)选简历,却(què)发现(xiàn)了系统对女性存(cún)在偏见导致最终关闭。更为(wéi)常见的是手机软件利用人工智能算法导(dǎo)致(zhì)的大数据“杀熟”,如(rú)根据(jù)手机类型的不同(tóng),可能会推荐不(bú)同类型的商品(pǐn),甚至打(dǎ)车时(shí)推荐(jiàn)不同(tóng)价(jià)格(gé)、档次(cì)的车(chē)辆。
目(mù)前,“AI+金(jīn)融”的发展如火如荼(tú)。但(dàn)当金融机构均采用人工(gōng)智能进(jìn)行决(jué)策(cè)时,其市场信(xìn)号解(jiě)读就可能趋同与(yǔ)不断(duàn)强化(huà),导(dǎo)致(zhì)形成偏离正常市(shì)场规(guī)律的结果。而这些不正常(cháng)的市场变化也会成为人工智能的学习(xí)基础,将人工智能的决策逻(luó)辑进(jìn)一步畸(jī)化,容易造(zào)成恶劣的后果。
以上这些问(wèn)题,影响着人工智(zhì)能赋能实体经济的(de)安(ān)全性,凸显产业(yè)对技术可信赖(lài)性的(de)呼唤。“从AI到可信赖AI,意(yì)味着我们需要(yào)在技术层面上(shàng)解决鲁棒性(稳定性)、可解释性和可复(fù)制性这些核心技术(shù)挑(tiāo)战。同(tóng)时(shí)为(wéi)了(le)大规模产业化应用,我们必须考虑到人工(gōng)智能的公平性和负责任。这(zhè)几个维度是人工智能必须要(yào)解决的问题。”周伯文说。
法(fǎ)律规制和伦理问题(tí)待(dài)完善
“目前的(de)智能(néng)算(suàn)法还存在给出的决策不符合伦理道德要求的问题。”姜育(yù)刚指出,在应用中已发现,智能算法的决(jué)策没有从改(gǎi)善人(rén)类生活、服(fú)务人(rén)类社(shè)会的角(jiǎo)度来进行。如智能音响在对话中出现“劝主(zhǔ)人(rén)自杀”的(de)内(nèi)容,聊天机器人学会了(le)骂脏话和(hé)种族(zú)歧视等。而这些不友好的决策都是(shì)模型从数据中学来的,并不是研发者对人工智能模型设置的目标。
同(tóng)时(shí),人工智能算(suàn)法需要海量的数据驱动,训练数据可以被算法恢复,个(gè)人隐私存在泄露和被侵犯的风险,而大量的数据也存在共(gòng)享壁(bì)垒。在人工智(zhì)能赋能(néng)金融的过程中,这一问题尤(yóu)被关注。最新报告显(xiǎn)示,近年来,每(měi)年发(fā)生金融隐私(sī)泄露(lù)事(shì)件(jiàn)以大约35%的速度在增长。加之近年(nián)来人(rén)工智能技术(shù)在(zài)金融行(háng)业的广泛应(yīng)用(yòng),由此带来的银行(háng)数据、保(bǎo)险数据、网贷业务及大数据等个人信息保护问题日益凸(tū)显。
在2020年(nián)抗击新冠肺炎疫(yì)情期(qī)间,人(rén)工智能技术在(zài)我国响(xiǎng)应速度快、介入力度大,帮助推(tuī)出了CT影像(xiàng)的(de)辅助(zhù)诊断系统,提(tí)升了医生诊断的速度(dù)和信心。然而,医疗影像智(zhì)能诊断发展也(yě)面临着(zhe)法(fǎ)律规制问题(tí)。与其他人工(gōng)智能赋能行业的大数据相比,获取高质(zhì)量的医疗(liáo)影像数据相(xiàng)对困难。不同(tóng)医疗机构的数据,目(mù)前还(hái)很少互通、共享。而单个医(yī)疗机构积累的数据往往不足以(yǐ)训练出有(yǒu)效的深度(dù)学(xué)习模型。此外,使用医疗(liáo)影像数据进行人(rén)工智能算法的训练还(hái)涉及保护病人(rén)隐私等非技术问题。
此(cǐ)外,近年来(lái),随(suí)着人工智能技术的(de)深入探索,科(kē)学界(jiè)有(yǒu)人提出研发“人工生命”,成为又一个伦理话题(tí)。对此,中国工程院院(yuàn)士李(lǐ)德毅表示,生命不仅有智能,更要(yào)有(yǒu)意(yì)识。从(cóng)伦理(lǐ)角度上,生命是(shì)人类的底线,触(chù)碰底(dǐ)线要慎之又(yòu)慎(shèn)。“所以,我们可以通过计算机技术(shù)继续(xù)研发没有意识、但有智能的高(gāo)阶机器。让人类的智能(néng)在体(tǐ)外(wài)延伸,保持(chí)它(tā)的(de)工具(jù)性(xìng),而非人(rén)工创造意识。”
深圳云天励(lì)飞技术股份有限(xiàn)公司副总裁郑(zhèng)文(wén)先同时提醒,“人工智能的技术进步可以给社(shè)会带来非(fēi)常正向的效益,不应因为对(duì)隐私保护机制等方面的忧(yōu)虑而将人(rén)工智能的问题妖魔化。”他认为(wéi),当前人工智能的法律法规(guī)尚不健全,亟待有关部门进一步科学制定(dìng)和完善,这样才能引导公众(zhòng)更加健康地看待这一新技术应用于产(chǎn)业(yè)。
亟待技术进步 发展新一代人工智能
面对(duì)技术落(luò)地所遇到的种种“痛(tòng)点(diǎn)”,许多专(zhuān)家给出(chū)了这样的比喻:“人工智能(néng)相当于一个(gè)锤子,不能哪一个钉(dìng)子都能砸。”
“我觉得,人工智能发展的第一步是辅助,让重复复杂的劳动量由机器(qì)完成,在这个基础上,我们(men)再创造条件(jiàn)逐渐向智能决策的(de)方向发展。”郑州大学(xué)教授蒋(jiǎng)慧琴表示,对于业界有人提出“人工智能(néng)超越(yuè)甚至取代人类”的期(qī)待和预计,应(yīng)保持(chí)冷静,“只(zhī)有(yǒu)沿(yán)着这样的方(fāng)向坚持下来,才(cái)有可(kě)能达到(dào)我们的目标”。
中(zhōng)国科(kē)学技术(shù)发展战略(luè)研(yán)究院研究员李修全认为,在重复性(xìng)操作的生产环节和基(jī)于海量数(shù)据的高强度计算优化求解上,人工智能具有明显优势,应当是当前应(yīng)用于产业的主要方向。
华(huá)为云人工智能领(lǐng)域首席(xí)科学家田奇则认为,加速(sù)人工智能赋能产(chǎn)业落地(dì),其与科学(xué)计算的深度融合(hé)应是(shì)显(xiǎn)著趋势(shì),在工业、气象、能源、生物(wù)、医学等领域,需(xū)要(yào)大量科学(xué)计算,人工智能技术能为传统科(kē)学计算带来新的思路、方法和工具,同时由于传统科学计算(suàn)具有严密性,人工智能(néng)也可(kě)以(yǐ)提高它本身的可解释性。
“推动人(rén)工智能进入新的阶段(duàn),有赖于与数(shù)学、脑科学等结合实现底层理(lǐ)论的突破。”中国科(kē)学院院士、清华大学人工智能研究院院长(zhǎng)张(zhāng)钹说,未来所需要的第三代人工智能应是实现可(kě)解释的、鲁(lǔ)棒的、可信安全(quán)的智能系统,依靠知识(shí)、数据、算法和(hé)算(suàn)力(lì)四个要素(sù),将实现从不带认知的(de)人工智能转变为(wéi)带认知(zhī)的人工智能。
如何解(jiě)释(shì)新一代人工(gōng)智能(néng)?李(lǐ)德毅认为,传统人工智能是(shì)计算(suàn)机(jī)智能,属于封(fēng)闭型人工智能。新(xīn)一代人工智能(néng)应该是开放性人工智能。当前,所有的计算机都(dōu)是对(duì)软件工程师的(de)智能编(biān)程代码进行(háng)一次又(yòu)一次简单(dān)执行(háng),“但我们希望这(zhè)个(gè)机器在学习(xí)过程中能够解决新的问题,学习应成为新一(yī)代人工智能解决现实问题的基础(chǔ)”。
清华大(dà)学(xué)智能技术与系统国家重点实验室教授邓志东建议,数据和算力(lì)的增加总有天花板(bǎn),要(yào)推动人(rén)工(gōng)智能技术(shù)深度赋能(néng)更多(duō)行(háng)业,需要的是核(hé)心关键技术突(tū)破(pò),特别是认知(zhī)智能的进(jìn)步,同时,还要依靠智能高端(duān)芯片(piàn)、传感器(qì)等零(líng)部件的硬件支撑,再借助我国5G信息技术的优势,形成合力支撑产业落地(dì)和商业化应用。
此(cǐ)外(wài),人工智能标准(zhǔn)化工作也应加速展开。薛云志表示:“建立可信(xìn)赖的(de)人工智能(néng)需要标准化,一方面要从开发者(zhě)训练、测(cè)试与(yǔ)实验、部(bù)署运营和监(jiān)管的角度来做,另一方面则要从芯片等硬件、算(suàn)法、产(chǎn)品系统出发,来(lái)制定(dìng)标准(zhǔn)和规范,同(tóng)时对人工智能的风险(xiǎn)、伦(lún)理、管理等(děng)标准研究也(yě)要尽快启动,这些都只是第一步。”