超级大脑!AI大模型有望重塑信息产业格局

AI+城市

发布时间：2022-01-06 09:50:40 来源：新华网发布人：阅读量：

　　《经济参考报》记者近日调研获悉，AI(人工智能)大模型相当于“超级大脑”，正成为人工智能“新高地”。AI大模型有望实现人工智能从感知到认知的跃迁，重新定义人工智能产业模式和产业标准，给部分产业带来重大变革。我国有较大的AI大模型应用市场，但发展过程中面临部分技术薄弱、人才稀缺、成本高昂等多重挑战，亟须对相关技术研发和产业布局加以引导和支持。

　　“学富五车”的“超级大脑”

　　——“不开心的话可以听点开心的歌，看看喜剧，也可以去运动，或者好好休息一下。”

　　——“心情不好是一种很正常的情绪，所以不用太过自责。”

　　针对“今天心情不好应该怎么办”这一问题，一个人工智能平台以不同的“人设”，给出了不同的回答。通过网址链接进入该平台，在“人设问答”区随机输入问题，机器可支持和扮演不同“人设”，对问题给出多角度答案。该平台正是基于AI大模型打造而成。

　　创新工场首席科学家、北京澜舟科技创始人周明介绍，AI大模型也称人工智能预训练模型，将海量数据导入具有几亿量级甚至十万亿量级参数的模型中，机器通过做类似“完形填空”等任务，深度学习数据中蕴含的特征、结构，最终被训练成具有逻辑推理和分析能力的人工智能。

　　通俗地说，AI大模型相当于做了无数套关于各领域知识练习题、模拟题的“超级大脑”，深谙各领域知识内在逻辑和解题思路，既能理解人类世界的知识体系，也可能产出新的知识。

　　2018年起，人工智能进入“大模型时代”，由重复开发、手工作坊式人工智能，即“一千个应用场景就有一千个小模型”的零散、低效局面，走向工业化、集成化智能的全新路径，以一个大模型“走天下”，为通用人工智能带来曙光。比如，为生产智能音响，各个品牌竞相开发各自的AI小模型，未来各品牌只需在同一个AI大模型基础上开发即可。

　　“以前是‘碎片化’的人工智能，针对不同的应用场景要开发不同的模型。作坊式开发对资源、成本造成较大消耗，且效率低下。未来在各垂直领域落地时，只需基于一个大模型，对其参数进行微调即可，这样就打造出了具有通用性质的人工智能。”华为云人工智能领域首席科学家、国际欧亚科学院院士田奇介绍，AI大模型将重新定义人工智能产业模式、产业标准，甚至产业伦理。

　　受访者举例介绍，以前的小模型就像“偏科的机器”，只学习针对特定应用场景的有限数据，“举一反三”能力不足，一些智能产品被用户调侃为“人工智障”的情况时有发生。而AI大模型则学习了各行各业各类数据，成为具备良好的知识迁移能力的“通才”，适用领域更广，产出内容质量更高，更加智能。

　　同时，周明指出，大模型的发展并非一味追求参数量大，而是聚焦模型的高性能，“在让大模型学习和掌握更大量数据的同时，尽可能让大模型参数相对轻量化，在‘减负’的同时提高能效。”

　　可分饰多角应用场景广泛

　　自动问诊、产品营销、小说续写……由于懂得人类语言，且具备细分行业专业知识，一个AI大模型可分饰多角，它做得了医生，当得了作家，胜任得了情感博主，从事得了电商客服……

　　AI大模型行业适用范围广，在医疗、金融、零售、气象、新闻传播、文学艺术等领域具有广泛应用场景。周明介绍，在大模型中输入关键词、主题、文本风格等控制属性后，即可生成满足约束条件的文本内容，可用于产品营销文案写作、电商智能客服等。在金融等领域，大模型通过抓取行业数据，自主完成筛选、分析，并自主撰写生成行业报告，辅助从业人员做决策。

　　田奇介绍，AI大模型已应用于国网电力部门的日常线路检测。“以前要识别各种电力传输线上的缺陷，需要针对每一类缺陷单独做一个小模型，有几百种缺陷就要做几百种模型，现在利用一个大模型就可完成各类缺陷的识别。”

　　值得注意的是，AI大模型目前的技术进步，是人工智能从感知向认知演进的关键环节。清华大学计算机科学与技术系副教授刘知远表示，古今中外一切文章、资料，都可作为训练大模型的数据。通过分析并“内化”海量知识，不仅让智能产品拥有更高性能，如机器翻译更加准确、机器写作更加生动有逻辑;还能品读人类情感，用于情感标注。此外，“它可能识别到‘弦外之音’，甚至有希望发现人类未曾掌握的知识。”

　　这一技术的发展，也可能给部分产业带来重大变革。周明说，未来将产生新一代搜索引擎。“目前大部分搜索引擎是基于关键词识别，只将库里已有的包含关键词的结果‘搬运’给用户，而基于大模型的新一代搜索引擎，通过理解人类语言，可以自主生成回答，且支持文字、图片、音频、视频等多模态搜索。”

　　田奇表示，新一代搜索引擎具备创作能力，比如搜索“长翅膀的猫”“会飞的猪”等现实中不存在的事物，搜索引擎也可根据描述生成相应照片。

　　多重发展难题待解

　　当前，美国OpenAI、谷歌、微软、脸书、英伟达等海外公司纷纷布局AI大模型产业，国内的华为、阿里巴巴、百度等大型企业，以及高校、科研机构也加入研发赛道。AI大模型正成为人工智能“新高地”。

　　记者调研了解到，从技术上讲，国内AI大模型已初步成熟，下一步将聚焦行业推广，并结合具体问题对模型进行迭代。田奇预测，AI大模型的大规模应用“可能还需要两到三年时间”，且未来AI大模型还有望集纳于芯片上，更方便落地应用。

　　专家指出，我国有较大的AI大模型应用市场，在应用领域具有优势，但发展过程中也面临一些挑战。

　　刘知远介绍，很多核心技术目前仍然掌握在发达国家手中，训练AI大模型需大量GPU(图形处理器)芯片，但当前国产GPU芯片技术相对薄弱。同时，我国在算法上的原始创新能力也有待提升。

　　多位受访者表示，目前从事AI大模型研发且能产出创新性成果的高校、科研机构和企业屈指可数，与国外相比，我国相关领域高水平基础人才培养力度有待加强。

　　此外，训练大模型需要较高的电力成本、设备成本等，很多中小企业、科研单位囿于高昂成本，无法搭建拥有充足算力的机房，面临算力不足的问题。

　　多措并举抢占“新高地”

　　多位专家表示，AI大模型有望实现人工智能从感知到认知的跃迁，将更高效地赋能AI产业化和产业AI化。相关技术研发和产业布局引导、配套支持政策、合理监管等举措能否有效落地至关重要。

　　首先，推进AI大模型标准化。受访专家指出，大模型的训练过程具有高能耗的特点，制定标准后，许多工作可基于已经开发的标准化大模型进行适配和二次开发，无需每次从头训练，以降低能耗。同时，大模型发展的过程中，也可能衍生违法违规信息生成、隐私泄露、虚假信息传播等风险，对用于训练模型的源头数据等做好规范，有利于规避相关风险。国家相关部门可牵头或引导企业、研究所、高校等共同定义大模型的标准。

　　其次，适当开放训练数据。受访者表示，训练大模型需要海量数据，出于对数据的隐私、安全等方面的担忧，一些领域难以获取数据，形成数据孤岛。建议在国家机构监管和宏观把控的前提下，各方数据能够对白名单企业、机构、高校适当开放，在确保数据安全使用的同时，增强我国AI大模型实力。例如，医院等机构适当开放数据，将有利于训练更懂医疗的大模型，赋能健康医药领域发展。

　　再次，鼓励算力共享。记者调研了解到，目前只有部分大企业能够负担超大模型训练所需的算力成本。受访专家呼吁，可引导具有强算力的人工智能“国家队”，为更多中小微企业、科研单位提供大模型训练所需的算力支撑，可探索合理付费的算力共享机制，共同促进技术的发展和资源的节约。

　　最后，加大原始创新引导和支持。多位专家指出，我国应加强研发力度，同时加强针对模型框架的基础创新研究，引导更多科研单位、高校积极培养相关人才，鼓励更多社会力量加入这场信息革命的浪潮。

更多 >热点快讯

更多 >推荐