六问六答：深度解构“杀手级应用”ChatGPT

通信产业网 2023-03-27

ChatGPT是爆款信息通信应用。

2023年初，《通信产业报》全媒体发布2023通信产业十大技术趋势，其中，AIGC被产业界15位专家联合提名发布。刚刚过去一个月有余，AIGC的重要落地应用ChatGPT就火遍全球，引起了社会广泛关注。那么，ChatGPT是什么？带来什么影响？中国版ChatGPT如何发展？通信产业如何着力？为此，《通信产业报》全媒体邀请AI领域一线专家透视ChatGPT本质。

本期特别邀请2022年度“全球前2%顶尖科学家榜单”入选者、联通数科首席AI科学家廉士国，深度解构ChatGPT概念、影响和通信业互动。

《通信产业报》全媒体：ChatGPT是什么？

廉士国：ChatGPT是一个面向对话场景的大语言模型，是在2020年发布的语言生成模型GPT-3版本基础上的改进版，又称为GPT-3.5版。它能通过与人类做文字对话的方式，针对人类输入的提示文字，提供相应的文字回答，且回答的内容“形式上合理”。

因为采用了自监督学习技术，而无需人工做数据标注，就可以用网络上大量公开文本数据来做模型训练，以形成沉淀了大量知识的模型。依赖于训练库中的文本数据涉及的领域，原则上只要是自然语言能够表述出的领域都可用来训练并能具备该领域的智能问答功能，例如历史、地理、数学、诗歌、编程等。目前大家在线体验的ChatGPT服务，是基于ChatGPT模型包装成的问答SaaS服务。

《通信产业报》全媒体：ChatGPT有什么影响？

廉士国：ChatGPT给人们带来新颖的体验，主要体现在其支持自然问答交互方式、能创作性组织文字内容、可记忆强大知识库、具备“多才多艺”能力等方面，在交互方式和能力上更“像”人。因为是基于自然语言数据训练的，其在自然语言或文字相关的功能上更成熟，例如百科知识查询、问题探讨或观点获取、文字创作等。

首先，会对搜索体验带来提升，包括更自然地输入内容、更丰富的输出结果呈现、更准确的内容组织梳理等，可在自然对话中完成更精准的搜索，或者说让搜索从关键词匹配逐渐过渡到语义匹配。其次，为文字创作提供便捷的辅助工具，例如写论文、编程序、回复邮件等，先为人工生成草稿以提升效率。另外，会提升对话闲聊的水平，包括对长句的理解能力、多轮对话能力、针对问题的内容组织能力等的提升，将革新智能音箱的体验。总之，基于ChatGPT基础模型，可以对例如搜索引擎类的信息查询工具做升级改造，可以制作文字创作工具作为人类的助手来提升工作效率，可以为人类提供专家级咨询参考和辅导等。

《通信产业报》全媒体：ChatGPT会如何影响AI产业格局和发展走势？

廉士国：ChatGPT目前在免费试用阶段，上线仅两个月已突破1亿用户数。据说后续会推出按月收费的商用版本，同时微软已正式推出基于ChatGPT的Bing搜索产品并正将其嵌入Office和Azure等产品中。

目前看，ChatGPT在B端产品中的定位相对明确，可作为辅助工具来改进已有产品或为人工提供助手功能。例如，虽然大模型里沉淀了大量知识，但它很难完全替代搜索引擎，因为其不能提供原始内容链接、不能做即时信息查询等，可作为使能工具来升级搜索引擎产品；它可为销售人员提供回复邮件自动生成工具，以降低人工工作量并提升效率等。

而作为C端产品，相对还不够明确，类似写论文、编程序、咨询顾问等的个人助手，是否存在合规性风险、商业模式问题等，有待探索，但同时也有较大可想像空间。但对算力基础设施的带动作用是明确的，无论是ChatGPT的研发（训练）和基于ChatGPT的应用（推理）都需要大量智能计算资源和数据存储及传输资源，因此具备智能算力中心的云计算企业将是受益者。从技术分层角度看，从底往上：智能算力平台、ChatGPT基础大模型、基于ChatGPT基础模型的AI应用或插件、行业应用系统。

可以预见：以智能算力平台为基础，会有少量公司做类似ChatGPT基础大模型，其他大量公司和开发者会基于ChatGPT基础模型做AI应用或插件，包括To B和To C类的，这些AI应用或插件可被集成到行业应用系统中。这种分层模式跟非大模型时代相似，只是现在大模型可能开始不再免费了，这是否说明会出现以ChatGPT基础大模型拥有者为中心的“寡头”？对标OpenAI的ChatGPT，谷歌刚刚发布了以其LaMDA大模型为基础的Bard对话服务。是否要出现类似iOS和Android两强对立的局面？

我们认为，目前阶段的基础大模型性能上还需完善，其门槛也没有高到只能出现两个“寡头”，更多玩家的局面将会出现。试用阶段的用户热度是否会延续，有赖于后续“爆款”AI应用的出现，但其对已有行业应用系统的升级辅助作用会持续体现出价值。

《通信产业报》全媒体：ChatGPT发展存在哪些挑战？它会对AI伦理、数字治理有什么影响？

廉士国：ChatGPT基础模型是基于文字间上下文关联关系做自监督训练的，以数据驱动为主、外加少量人工介入，其功能依赖于训练数据的数量和质量。从近期的大众试用反映来看，如果通过百科知识问答、写诗、做数学题和查询天气等测试来分别评估当前基础模型的记忆、创作、推理、查询能力，其相对从强到弱的排序是：记忆能力、创作能力、推理能力、查询能力。其推理能力相对较弱，这印证了国外部分专家的评价：当前版本模型对自然语言文本规则和模式知识学得较好，但对抽象知识和逻辑推理还没有学到位。其信息查询能力依赖于其训练数据的截止搜集时间，例如问“北京明天的天气是？”其回答“北京明天25度，天气晴朗”，因为其训练数据截止到2021年春夏之交，仅能查询2021年之前的信息。即使其创作能力较强，写出的诗、论文和问题建议在形式结构上看很合理，但细究其内部逻辑仍有不合理的拼凑感。

尽管ChatGPT本身还存在一些技术挑战，但大家已经看到了其威力，甚至已对现行制度带来了不利影响，例如有国外学生用它来代写课题论文并获得了高分，这给其他同学带来了不公平。的确，ChatGPT的出现超出了大家的预期，但我们的数字治理还没有跟上。像这样具备文字创作等能力的超级助手，人人都可以平等获得吗？其创作的内容存在版权问题吗、是否可以自由使用而不受限？其创作的内容如果存在编造事实、民族歧视、侵犯隐私等问题应由谁来担责？等等问题是需要大家共同来面对的。而人工智能领域的专家们已经开始考虑用技术手段来鉴别AI生成的内容了，例如通过人工规则来判断内容合法性、通过文本内容统计分析及添加文本水印等方法来鉴权等。我们相信，除了技术手段之外，相关的数字治理制度也将启动建立。

《通信产业报》全媒体：中国版ChatGPT如何发展？

廉士国：类似ChatGPT的大模型可通过基于自然语言的自监督学习技术实现对知识的沉淀，可作为公共的基础模型，支撑多种上层应用。因此，构建中文版的ChatGPT形成具备中文知识的公共基础模型，也尤为重要。

研发类似ChatGPT的大模型，其基础主要包括智能算力、大量数据、自监督学习算法等。对于这些基础，国内相关企业和机构是拥有的或可以联合构建。之前，已有国内企业和机构发布了大模型，包括语言大模型、基于语言大模型的多模态模型等，只是其语言大模型还没达到ChatGPT的能力。刚刚已有几家国内企业宣布在ChatGPT上做布局，相信国内很快会出现类似ChatGPT的语言大模型，并且对中文效果更好。

另外，国内的应用场景丰富、开发者众多，以ChatGPT类大模型为基础，面向垂直应用场景的再开发，可能出现“爆款”智能应用。而且，考虑到国内千行百业数字化转型的趋势，会产生丰富的行业场景数据，可能推进行业大模型的快速发展，包括语言类、多模类等，不限于对话场景，可在基础模型上做微调或重训练。

最后，ChatGPT的研发模式和历程值得我们借鉴。一方面，ChatGPT的研发要以巨大的算力和数据以及最前沿算法为基础，OpenAI公司能聚齐这些资源并具备产学研用融合特点，这种以公司牵头的产学研用融合研发体系值得借鉴。另一方面，虽然ChatGPT仅仅是OpenAI追求的AGI（通用人工智能）的初级阶段，但我们已看到了其创新带来的巨大影响力，这得益于OpenAI创始人和投资者的远见和坚持。大家可能还记得，OpenAI和DeepMind的投入-产出问题（亏损情况），曾是大家热议的话题，也反应在国内AI领域投资的波动上。从ChatGPT基础模型的研发历程来看，大模型研发是中长期积累的产物，如果仅追求短期回报可能反而会错过机会。这也给了国内投资者和创始人以启示，大的创新是需要中长期的坚持的，尤其人工智能领域还有很多未知待解决，就更需要坚定客观正确的方向不动摇。

《通信产业报》全媒体：ChatGPT对信息通信业有什么影响与互动？如何利用？

廉士国：ChatGPT实现了人与机器之间以文本方式“communication”的功能，接近甚至超越了人与人之间以文本方式聊天的体验，这与信息通信业要支撑的丰富人们的沟通与交流相似。

首先，ChatGPT大模型可作为工具用来改进信息通信服务能力，例如其在自然语言上的强大能力可用于提升智能客服、智慧运营、欺诈监测等运营服务功能，通信网络的巨量数据量可用来训练通信网络大模型赋能网络自主运行。其次，ChatGPT在自然语言上的成功，启示了在语音、视觉等多模态数据上的扩展空间，这将为运营商在政企业务上为千行百业数字化转型赋能提供重要工具。而且，ChatGPT等大模型的运行和服务离不开算力和网络支撑，运营商作为新型信息基础设施服务运营者，可以加强算网融合的智能算力中心建设，来承载ChatGPT等大模型训练和推理服务，真正让大模型服务遍及无处不在的用户。

可以预见，ChatGPT的流行会让人机自然对话的交互方式越来越普及，并很可能从文本对话模式扩展到语音对话模式，以及与数字人面对面交流模式，进而将大大提升信息通信流量和用户粘度，这也将推动信息通信业考虑从人与人之间的沟通交流扩展到人机之间的沟通交流。虽然传统搜索引擎已经不再是搜寻或咨询信息的普遍方式了，部分代之以基于知识沉淀的大模型构建的文本/语音/数字人对话机器人，但这对信息通信的依赖程度有过之而无不及，因而通信行业更应该拥抱大模型。

附专家简介

廉士国

现任联通数字科技有限公司首席AI科学家、科技委副主任。受聘中国图形图像学会三维视觉专委会专家委员、IEEE多媒体通信/智能计算等技术委员会委员，曾担任武汉大学等高校的兼职教授。参加了国家自然科学基金、欧盟第六框架、北京市科委等资助的多项重大科研项目，在相关技术领域编著/合著多部专著，论文、专利等200多项，并获得江苏省优秀博士论文、法国电信全球创新奖、华为金牌团队奖、联通集团技术进步优秀奖等，入选美国斯坦福大学公布的2022年度“全球前2%顶尖科学家榜单”。其致力于打造具备“职业技能”的行业AI将科技用于实际，在赋能电信服务、产业升级和社会民生等千行百业的数字化转型方面积累大量实践，已助力智慧交通、城市、工业等100多个客户实现高质量发展，目前正投身行业AI范式研究，即基于中国联通的云网资源基础和客户触点优势，探索和构建AI落地赋能千行百业实体经济的方法论。

采写：崔亮亮

编辑：亮亮

指导：新文

延伸阅读：

新年展望：2023通信产业十大技术趋势

判断2023 | 黄宇红：通信产业的十个技术趋势

判断2023 | 陈山枝：通信产业的两个技术趋势

跨年思享 | 张成良：云网融合是信息技术发展必然趋势（附PPT）

跨年思享 | 温晓君：“东数西算”下的算网融合趋势

判断2023 | 四位专家的算力展望

推荐阅读

新春走基层 | 五线城市5G样本：冷热不均，规模渗透还要优资费