科大讯飞“解放生产力,释放想象力”发布会将颠覆你哪些认知?

中新皖事微信公众号   2023-08-16 21:16:01

8月15日,科大讯飞将在中国•合肥滨湖国际会展中心召开“解放生产力,释放想象力”讯飞星火认知大模型V2.0 升级发布会。该模型开放了多模态能力,突破了代码能力,提升了通用能力。科大讯飞董事长刘庆峰、科大讯飞研究院院长刘聪将发布讯飞星火认知大模型V2.0,在持续提升通用能力的基础上重磅发布代码及多模态能力,同步发布多项相关产品。

ChatGPT发布以来,认知大模型技术持续进化,人工智能在全球引起了广泛关注。

2022年12月15日,科大讯飞依托其承建的语音及语言信息处理国家工程实验室和认知智能国家重点实验室,启动认知大模型专项攻关。自今年5月6日,该公司发布讯飞星火认知大模型以来,科研团队进行了多轮技术升级。


(相关资料图)

此前发布的讯飞星火认知大模型具备七大维度能力,包括文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力,并已在教育、办公、汽车、数字员工等行业中落地应用。

认知大模型需要一套科学系统的评测体系。科大讯飞通过认知智能国家重点实验室,牵头设计了通用认知大模型评测体系,并与中国科学院人工智能产学研创新联盟和长三角人工智能产业链联盟共同探讨形成了覆盖7大类481个细分任务类型,在科学的评测体系中,推动认知大模型的发展。

据新华社报道:近来,人工智能大模型风云起涌,不少科技企业加快拓宽应用生态。主流大模型的实际使用感受如何?各大科技企业有何优劣势?8月12日,新华社研究院中国企业发展研究中心发布的《人工智能大模型体验报告2.0》(以下简称报告)显示,讯飞星火、百度文心一言、商汤商量和智谱AI-ChatGLM均表现抢眼,AI大模型的发展为人类工作和生活的提质增效均带来了正向积极的影响。

今年以来,国内科技企业纷纷布局人工智能大模型。据不完全统计,在新一轮生成式AI热潮中,国内已经出现了上百个大模型。天眼查数据显示,截至2023年上半年,与“大模型”直接相关的融资事件超20起。

为进一步直观感受我国当前主流科技企业所推出的大模型产品的现状、优势和特点,新华社研究院中国企业发展研究中心于今年7月启动了本次报告研究。与2023年6月首次发布的《人工智能大模型体验报告》相比,本次测评在题目设计、对标Benchmark(人类)、打分权重、专家测评团队四大维度进行了全面升级。

其中,在题目设计方面,测评题目由300道扩展至500道,并进一步完善了题目分类;在对标Benchmark方面,本次测评将接受过高等教育的人类作为对照,来考评大模型真实能力;在打分标准上,本次测评根据对产业、生活的实际价值,对基础能力、智商能力、情商能力和工具提效四大测评维度进行了权重设计;在测评团队方面,本次测评特邀北京大学文化与传播研究所及其他产界、学界专家全程参与。

本次研究设置了用户体验项目,抓取了7月31日—8月4日数据,通过人机互动提问等形式,对国内主流大模型进行使用体验评测,旨在为科技企业调整努力方向提供参考。

报告显示,与2023年6月相比,当前中国大模型产品进步显著。但与接受过高等教育的人类相比,大模型在智商、情商等方面还存在一定程度差距。具体来看,讯飞星火在工作提效方面优势明显,百度文心一言基础能力仍处领军水准,商汤商量则在情商方面表现优秀,智谱AI-ChatGLM整体表现优秀。

针对各维度能力测评,该报告还给出了相应的案例展示和分析。

在基础能力方面,人类与AI之间的差距并不显著。课题组分别从语言能力(35%)、AI向善(10%)、跨模态(20%)和多轮对话(35%)四大指标进行测评。测评显示,科技企业大模型中,百度文心一言表现最为抢眼,商汤商量、智谱AI-ChatGLM、360智脑表现优良。

在智商评估方面,人类在智商方面仍然具有明显优势。课题组分别从常识知识(20%)、逻辑能力(50%)和专业知识(30%)方面对科技企业大模型进行考量。结果显示,讯飞星火、智谱AI-ChatGLM表现突出,百度文心一言、昆仑万维天工表现优良。

在情商方面,AI与人类之间的差距最为明显。人类在情绪理解和处理方面通常具有更强的优势,和更灵活的处理能力。通过对处理日常事项(35%)、一语双关(30%)、人际关系(35%)问题进行分析发现,科技企业大模型中,商汤商量表现亮眼,百度文心一言、澜舟科技Mchat、智谱AI-ChatGLM及360智脑均表现优良。

在工作效率提升方面,课题组重点在工具提效(50%)和生成创新(50%)方面进行考量。结果显示,讯飞星火表现最为抢眼,百度文心一言、商汤商量、智谱AI-ChatGLM表现优良。不过,尽管AI具有高速度和高效率的优势,但在某些复杂和具有创新性的任务中,人类的智慧和想象力仍然具有无法替代的作用。

报告认为,虽然在不同领域中,AI和人类表现出不同的优劣势,但在整体上,AI大模型的发展为人类工作和生活的提质增效带来了重要的积极影响,大模型正在加速走进生活、走进产业。在本次体验测评基础上,研究团队将继续深耕,加强在大模型安全可解释性、工作提效能力、实际落地情况、产业优秀案例等维度上的探索与研究。

此前,2023年5月6日科大讯飞董事长刘庆峰接受中新社记者采访表示,目前认知大模型技术还有待攻克的缺陷,比如新知识难以及时更新,事实类问答容易“张冠李戴”,史实、传统典籍容易“编造情节”等。今年,研发团队将对标ChatGPT,对认知大模型进行三轮升级,包括突破开放式问答,升级多轮对话能力、数学能力、代码能力等。

未来,研发团队将在保护伦理和安全的前提下发展认知大模型,同时联合开发者推动认知大模型应用落地,共建人工智能“星火”生态。

2023年8月11日,刘庆峰在AI大模型资本产业峰会暨第九届上市公司年会上透露。讯飞星火2.0发布会上,科大讯飞还将联合华为推出讯飞星火一体机,“这会使得所有企业更方便、更自主、更安全可控的私有化部署大模型能力,在完全国产自主创新的平台上,进行私有化部署,保护自己的数据安全。”

刘庆峰认为,认知大模型有望打造每个人的工作助手和生活助手,有了自然语言理解技术和长链条逻辑推理,通用人工智能助手能够像人一样调用各种工具,无论是出差旅行还是工作,大模型都可以理解人的意图,而且帮助人类去联络相关伙伴,最终呈现出结果跟和决策。

刘庆峰认为,要推动大模型在各个领域的落地,必须实现技术自主可控。在这个过程中,首先要在源头技术上要进行持续的创新,无论是对大模型本身的算法能力的研究,还是对于脑科学和通用人工智能算法的结合,存在众多源头创新的土壤和机会。

“有了源头技术的创新和自主可控,还必须根植于自主可控的硬件平台之上。”刘庆峰表示,科大讯飞和华为、寒武纪、曙光有着深度合作,讯飞星火2.0的很多能力是直接在华为的新平台上训练出来的。

知名作家、安徽大学新闻传播学院教授,历史学博士章玉政表示,人工智能开启了新的技术革命想象图景,必将深度嵌入人类生活的各个场景。科大讯飞的星火认知大模型上线以来,在AIGC赛道频频出圈,在智商指数、工具提效等维度具有明显优势,期待星火2.0将在代码能力、多模态能力等方面有更多突破,带给我们更多惊喜!

而合肥科大讯飞15日的“解放生产力,释放想象力”讯飞星火认知大模型V2.0升级发布会将颠覆您的哪些认知,值得期待!