要闻简报
 
教育通用人工智能大模型标准研讨会在上海成功召开

教育通用人工智能大模型标准研讨会于2023年5月31日,在上海交通大学徐汇校区总办公厅二楼会议室成功召开。本次研讨会由教育部教育信息化技术标准委员会暨全国信息技术标准化技术委员会教育技术分技术委员会(简称“教标委”)主办,上海交通大学与华东师范大学联合承办。来自上海交通大学、复旦大学、华东师范大学、华中师范大学、江苏师范大学、上海开放大学等国内高校学者,以及华为、百度、科大讯飞、北京世纪好未来、思必驰、松鼠AI、作业帮等企业专家近40人相聚一堂,共同探讨教育通用人工智能大模型标准的研制。

自2022年底ChatGPT发布以来,生成式通用大模型迅速在全球掀起来革新热潮。大模型给各行各业带来无限可能的同时,其局限性以及在个人隐私和伦理方面的风险也让人们感到非常担忧。其中美国政府科技政策部门和教育部分别在今年5月发文,提出了对人工智能系统和应用进行标准化、规范化的明确需求。教标委于2023年3月18日举办了“ChatGPT教育应用与人工智能标准”学术沙龙;本次会议是教标委积极应对ChatGPT为代表的生成式通用大模型快速发展所需标准的研究进一步推进。研讨会上午学术报告场由上海交通大学E-learning团队负责人申丽萍副教授主持,华东师范大学吴永和教授,上海交通大学X-lance实验室负责人俞凯教授,上海开放大学肖君团队的白庆春研究员,华东师范大学赵佳宝研究员共同探讨了教育领域下通用人工智能大模型的应用与研究。上午企业案例场由上海开放大学信息与网络管理中心主任肖君主持,华为系统架构专家张军城,百度技术经理沙燕霖,科大讯飞副总裁王士进,北京世纪好未来科研合作总监竺林等发表了主题演讲。研讨会下午场分别介绍了4个教育通用人工智能大模型相关标准草案并进行了热烈讨论。

会场2.jpg

教育生成式人工智能大模型标准及其体系研制的思考  吴永和

吴永和.png全国信息技术标准化技术委员会主任吴永和教授在致辞中表示大模型的产生,是计算机科学领域乃至其他领域的范式转变,影响了各行各业。他从教育技术发展史的角度进行切入,强调了技术对于教育的巨大改变。具体到教育领域,吴永和教授列举了很多大模型可以应用的教育场景和美好的应用前景,但是目前还存在着一定的局限性,例如准确率和伦理问题等。他提出教育领域大模型带来的挑战,要求我们提升师生人工智能核心素养,要求尽快研制标准规范,加强对于大模型教育领域应用的监管。吴教授还结合教育部的指导意见,提出未来教育必将与人工智能、大数据等未来技术领域相结合进行数字化转型,产生新的数字教育范式。最后,吴教授阐述了目前大模型在教育领域标准制定的一些现有工作,为会议接下来的分享与标准的制定起到了提纲挈领的作用。


跨模态通用语言大模型  俞凯 

俞凯.png上海交通大学俞凯教授从专业知识的角度深入分析了跨模态通用语言大模型的原理与应用。俞凯解析了以ChatGPT为代表的通用语言大模型的训练过程,分析了非文本模态的信号与基于文本的语言大模型进行融合的基本框架,并从大规模数据预训练、多模态指令学习以及人在环路的强化学习等几个方面详细进行了说明。俞凯教授还从人工智能安全的角度分析大模型应用需要注意的问题,特别是特朗普一段人工合成的语音以假乱真,给人工智能在教育中应用的安全性敲响了警钟。最后,俞凯教授分析了通用语言大模型对科研及教育的范式影响,尤其分析了数据驱动与智能驱动两种范式的联系与区别,为整个会议加强了技术和知识基础。


生成式人工智能赋能在线学习应用场景与规范设计  白庆春

白庆春.png上海开放大学肖君团队的白庆春研究员分析了生成式人工智能在教育中的几个可能的应用方向与应用潜能,并基于大模型在开放大学的应用经验提出了可能存在的伦理风险,强调了大模型在教育领域中的应用进行标准制定的必要性,同时提出了标准制定方面四个建议:技术标准包括数据处理和隐私保护、算法模型安全性、人机交互等,可视化交互标准包括界面设计、交互方式和个性化推荐等,人工智能素养标准和学习效果评估标准。                                                                                           


大模型在教育领域中应用的综合性能评测  赵佳宝

赵佳宝.png华东师范大学赵佳宝研究员介绍了他们团队研究开发的教育领域大模型测评框架EduTEP,包括人及混合评测和自动化评测两种方法。基于开放式文本问题的人机混合测评分为教学知识、学生发展、内容知识三大模块,并针对每个模块内的具体知识点,从记忆、理解、运用、分析、评价、创造六个层级,评估大模型在智能教育领域的应用性能。自动化模型测评方法针对大模型在K12教育中应用时基础能力、中阶能力、高阶能力所能达到的水平以及可能产生的伦理问题进行了检测。基于这些尝试,赵老师提出了在评测方面存在的一些问题和未来的发展前景。                                 


chatGPT的下一步 张军城

张军城.png华为系统架构专家张军城介绍了华为的盘古模型,并基于当前chatGPT的发展现状,分析了未来语言大模型的发展趋势与应对策略。华为目前设计了多领域语言大模型集群,在教育、医疗等领域具有专业性以及编程能力,能够更准确地服务于生活。在遥感领域,华为已经训练出了优质的百亿级别参数的多模态大模型,可用于天气预报、GPS定位、国土监测等领域。张军城提到,大模型的下一步的方向是通用人工智能,并列举了几个大模型应用的优化方向,提出未来将需要更多的人力和更大的组织来发展人工智能,这对教育等各行各业都会产生很大的改变。张军城认为,如何基于人类的反馈来构建友好的人工智能,如何使人工智能的行为符合人类社会的道德规范,将是未来很重要的研究领域。人工智能的发展前景非常广阔,将会对整个社会带来非常大的改变。


深度学习平台+大模型 夯实产业智能化基座 沙燕霖

沙燕霖.png百度技术经理沙燕霖介绍了百度深度学习大模型的进展,以及百度内部对于大模型产业的思考。随着深度学习带动的第三次人工智能热潮,大模型能够带来三大产业机会,包括新型云计算、行业模型精调和应用开发。在大模型的演进历程中,百度在硬件、框架和算法上都进行了深厚的积累。百度的大模型系列名为“文心”,定位为产业级的知识增强大模型,具备通用性、可拓展性和安全性,可以支持大规模的商业应用。百度的大模型系列横跨自然语言处理、计算机视觉、跨模态和生物计算等领域,并与行业合作发布了多种行业大模型。在教育领域中,百度飞桨平台提供了海量数据集、产业案例、课程资源和比赛平台等,能够全方位深层次的服务于教育领域,创造更好的人工智能教育生态。


讯飞星火大模型技术进展及在教育的应用思考 王士进

王士进.png科大讯飞副总裁王士进介绍了科大讯飞星火认知大模型,以及通用认知大模型评测体系的建设。2023年5月6日,讯飞正式发布星火大模型,获得各界广泛关注和领导高度重视,讯飞已为星火认知大模型的“智能涌现”做了超过十年的源头核心技术储备。王士进认为,虽然大模型在不少领域已经体现出了优秀能力,但仍有待攻克缺陷,如新知识难以及时更新、事实类问题“张冠李戴”和编造事实等。在教育领域,星火大模型在教学设计、自主学习、信息科技和心理健康领域有着广阔的应用前景。王士进认为,面对这样划时代的前沿技术,我们在推动发展的同时也需要关注大模型的伦理和安全问题。通用大模型的能力评测面临多种挑战,而讯飞使用多样性的测试、讯飞开放平台开发者需求分析和多年服务教育的经验,致力于建设通用认知大模型评测体系。


好未来教育大模型-MathGPT研发进展 竺林

竺林.png北京世纪好未来科研合作总监竺林介绍了好未来教育大模型MathGPT的研发进展,以及研发团队的人员配置和硬件资源。竺林认为,现有的大语言模型在自然语言处理领域具有出色表现,但在数学问题上功底较差。针对现有的模型擅长文科而不擅长理科方面的推理和计算这一特点,好未来以数学领域的解题和讲题算法为核心,不基于现有大语言模型做微调和接口调用,自研基于专业领域的数学大模型MathGPT,致力于用技术打造自主、稳定、可持续、高质量的学习解决方案。竺林介绍了数据处理的业务链路、评估方式、研发团队的人员配置和硬件资源等,表明了好未来自研数学大模型MathGPT,打造高质量学习解决方案的坚定信心。

上午的报告精彩纷呈,下午来自各大国内高校和企业的专家学者对4个标准草案进行了热烈讨论。上海交通大学俞凯教授介绍了教育通用人工智能大模型的信息模型,包括通用大模型层、微调层、应用层和外部接口四个模块。通用大模型层是用于通用领域的基础大模型,一般包括跨媒体编解码器和记忆池两个部件;微调层指的是用于将大模型微调成特定教育阶段的大模型,有微调策略和层次化教育大模型两个部件;应用层用于将特定教育阶段大模型输出的结果根据场景完成不同的任务;外部接口指的是模型调用外部接口辅助解决任务的模块,包括工具调用池和其他特化大模型接口。     华东师范大学吴永和教授介绍了教育领域对大模型数据的要求,包括学习内容的多样性、学习任务的多元化、标注的准确性、专业性、学习过程的动态性等。数据标准定义关于教育大模型的元数据实例结构的信息模型,适用于教育大模型数据集的设计、开发与管理过程中的内容、形式及其他特征的描述。同时特别定义了一个教育领域九大任务,包括自然语言理解、阅读理解、常识推理等。上海交通大学申丽萍副教授介绍了教育大模型评测标准草案。评测标准规范一系列用于评估大模型全方面能力的指标和维度,涵盖可靠性、安全性、可信度和偏见与歧视指标,评测维度包括基础能力评测、学科相关任务、场景相关任务、价值观评测任务、安全评测任务和数据合规评测。其中非常重要的是如何量化各个指标,以及如何生成各个维度的评测数据集。最后华东师范大学吴永和教授介绍了整个教育大模型标准体系框架,除了前面介绍的3个标准,还包括平台标准(运行环境)、服务与应用工具(接口)、安全伦理隐私标准、监管和应用规范等。专家学者们从专业的角度对教育大模型的框架、数据、评测、应用、监管等作出了精准分析,提出了很多建设性意见。

本次研讨会加速了我国教育通用人工智能大模型标准的研制,加强了国内高校、科研院和企业在教育领域人工智能应用的基础研究与应用等方面的学术交流与合作。会后标准研制小组将根据会议讨论结果以及专家们提供的相关材料和宝贵建议,继续修订四个标准草案,并向标委会提出立项申请。立项后将成立标准研制工作组,广邀各位委员和专家加入,着眼未来,携手打造高质量、有温度的人工智能教育生态。


友情链接 Links

秘书处地址:清华大学计算机系

联系人:郑莉

联系电话:13901352426