东北大学华裔教授研究团队 开发聊天机器人为中文编程

【中美创新时报波士顿9月29日讯】(记者温友平)最近,全球语言科技教学联合会旗下的语言学习技术期刊发表了东北大学(NEU)社会人文学院教授蔡安和电脑学院教授康迪诺作为共同作者的学术研究论文《开发聊天机器人:为外语编程》。该论文详细介绍了东北大学世界语言中心科研团队成功开发的中文聊天机器人的研究和应用过程,以及外国人学习中文所取得的巨大成果,从而得出结论——这个开创性的项目让语言学习者有机会模拟与母语人士的交流。

据介绍,该研究团队根据经验,不仅为学生制作了预先设计的聊天机器人供学生练习中文,还进一步制作了一系列YouTube培训视频,教用户自己制作聊天机器人。然后,他们可以使用免费的 Dialogflow Essentials (ES) 版本轻松设计聊天机器人以满足他们自己的任何语言需求。因此,教师和学生可以轻松采用这种创新方法来定制自己的语言材料,以促进沉浸式、自定进度的学习。这种跨学科的方法探索了语言学习中尚未开发的可能性,并解决了远程学习面临的一些关键挑战。该研究项目利用人工智能交流聊天机器人作为补充工具来满足口语练习的充分需求。这种方法可能会被其他外语教育者和学习者用作原型,以取得巨大的效果。

蔡安教授表示,在整个研究和写作过程中,如果没有许多个人和组织的特殊支持和宝贵贡献,这篇论文及其背后的研究是不可能完成的。由此,她代表研究团队真诚地向以下所有人员表示衷心的感谢:东北大学 (NEU) 世界语言中心主任Stacey Katz Bourns 博士;NEU 人文中心提供合作研究集群补助金;“Chat with Chatbot”研究组成员何欣儒、李培莹、邵婉如、范小雨、DQ董强;NEU 暑期 Startalk 中文项目主任Vanessa Wei 博士;华硕 AI 组长许佩文 & Ray Lai。

开发中文聊天机器人的现实需求

该学术论文首先指出,随着深度学习技术的进步,过去几年,四大计算机公司(谷歌、微软、Facebook 和亚马逊)一直在开发各自的机器人、机器学习和人工智能 (AI) 领域,其中包括人工智能聊天机器人,就是模拟和处理人类对话的计算机程序。与此同时,这些公司还努力通过将其融入现实生活和教学计划来扩大其最先进技术的影响。因此,对于一线研究人员和教育工作者来说,使用人工智能聊天机器人技术来提高课堂内外教与学的有效性既是挑战也是机遇。

随着世界的变化和对全球事件(例如 COVID-19 大流行)的反应,人工智能对话聊天机器人可能是一种非常强大的工具,可以模拟语言学习者的对话伙伴。它们也可以很容易地应用于远程学习环境。但是,与聊天机器人交互的质量受到代码预先指示的方式的限制。AI 聊天机器人通常用于自动执行简单的任务,例如回答客户的问题、提供产品信息和下订单。然而,语言学习领域需要进一步的规范和定制以满足语言学习者的需求。

据介绍,中文聊天机器人研究团队,包括来自人工智能研究领域(人机交流)和世界语言中心(人机交流)的教职员工。该研究项目旨在调查如何利用人工智能技术提供聊天机器人应用程序作为语言学习合作伙伴。该研究团队及其项目是东北大学 (NEU)世界语言中心的资助项目,其目标是让开发人员、研究人员和语言教育工作者共同努力,采用尖端技术。

该项目将 NEU 的创新精神用于创建可以说普通话并与中国学习者进行现实对话的聊天机器人。这些名为 Husky C-Bots 的机器人旨在通过根据学习材料复习词汇和语法结构来帮助汉语学习者练习语言技能。Husky C-Bots 可以直接从基于网络的聊天机器人应用程序访问。还定制了一个特殊的 Google Chrome 扩展程序(Dialogflow Helper)来大声播放文本响应。这鼓励学生更专心地聆听音频响应,而不是仅仅依赖短信。

该论文介绍说,开发Husky C-Bots中文聊天机器人是对多个知名的机器人设计平台进行了比较研究的结果。在权衡各种选项后,选择了 Google Dialogflow,因为它通过文本和语音输入/输出都支持中文。因此,所有版本的 Husky C-Bots 都是利用 Google Dialogflow 平台创建的。Dialogflow Essentials (ES) 版可以免费使用。

据介绍,谷歌聊天机器人基于 AI 的 Dialogflow 是一种基于网络的工具,设计人员可以使用它来创建他们定制的双向对话应用程序,也称为代理。代理可以有效地与最终用户交互。在 Dialogflow 平台中,Husky C-Bots 由一组三个代理(HuskyChatbot1101、1102 和 2101)组成:HuskyChatbot1101包含姓名、国籍、家庭、约同学和整体自我介绍5个实用话题;HuskyChatbot1102 包含约见医生、约见老师、购物*、交通和询问天气* 5 个情景对话主题/意图;HuskyChatbot2101 包含预约、订餐、问路、看(医疗)医生、换钱*、租公寓*和复习考试 6 个主题/意图。其中,上述标有*的4个意图/主题检索实时数据,例如天气预报,当前货币汇率等。

中文聊天机器人研究设计与开发过程

论文指出,本项目研究采用了渐进式行动研究方法:1) 提供战略性设计的“与聊天机器人聊天”学习计划;2) 通过用户数据收集的各种行动周期检查其有效性并确定需要改进的领域;3) 开发下一个聊天机器人迭代。自2020年春季学期以来,整个项目经历了多次迭代。研究成果通过以下三个阶段取得。

第一阶段:在 2020 年春季学期,研究团队首先为中级汉语学习者设计了双向对话聊天机器人(CHNS2101),然后将 HuskyChatbot2101 集成到基于人工智能的虚拟助手移动应用 Google Assistant 中,供学生在他们的手机上练习汉语。但是,研究遇到了以下技术问题:a) 谷歌助手目前只支持繁体中文; b) 由于学生的口音输入,调用聊天机器人具有挑战性,c) 谷歌助手错误地提供了超出我们学习环境范围的无关紧要的现实生活响应。因此,学生的体验并不像第一次演绎那样积极。根据学生的反馈,研究团队立即测试了一个不同的选项,并将用户界面从 Google 助理手机应用程序切换到 Dialogflow Web-Demo(基于网络的)集成。

第二阶段:学生通过一组三步脚手架任务练习基于网络的聊天机器人:1) 文本输入练习(阅读和打字),以建立学生对聊天机器人可用性的信心;2) 语音输入练习 (听力和口语),以及 3)通过识别步骤 2 中 Dialogflow 默认识别器生成的语音到文本 (STT) 识别字符错误,比较和更正前两个步骤中的两个屏幕截图的练习。由于研究框架基于渐进式行动研究方法,因此研究团队收集了 3 个学期(2020 年春季、2020 年秋季和 2021 年春季)的学生反馈,包括每个特定主题的聊天机器人练习(用于改进目的)和一般学期末用户体验问卷(15项)。

第三阶段:为了使聊天机器人对话更加真实并促进语言沉浸感,从 2020 年秋季开始,Dialogflow 电话网关作为口头单元测试被集成到聊天机器人中。整合后,学生可以拨打一个电话号码,通过模拟电话与聊天机器人通话,类似于自动银行呼叫中心。

学生使用中文聊天机器人的良好效果

论文介绍说,在经过了三个阶段后,学生反馈良好。在每学期结束时(共三个学期),65 名学生参加了一份 15 项问卷,以收集与以下研究问题相关的数据:作为语言学习的一部分,有多少语言学习者愿意与聊天机器人互动?学生是否发现他们与 AI 聊天机器人的互动有助于他们熟练掌握目标语言?外语学习中人机交互与人机交互的优缺点是什么?

论文总结出了从学生反馈中产生的新兴主题及其良好效果:

一是提高可接受性。大多数学生 (75%) 表示愿意与聊天机器人一起练习,而一些学生表示,由于聊天机器人无法识别他们带口音的中文语音,他们最初感到沮丧。基于渐进式行动研究框架,研究团队一直在每学期内外不断提高用户体验的质量。结果,学生最终记录了积极的反馈,尤其是在成功练习聊天机器人后产生的成就感。

二是提高语言技能。关于学生对聊天机器人是否帮助他们提高这些语言技能的看法:发音、口语、听力、阅读以及字符识别和打字。自我评估结果表明:

1. 口语和发音的改善被评为最高。一些学生的评论是:“说话是我觉得从聊天机器人中受益最多的领域。练习口语的最佳方式就是实际操作,而聊天机器人是实现这一目标的好方法。”“因为这是在课外练习演讲的唯一真正方法,而且随着机器人变得越来越聪明,它让我可以更有效地练习。”“这对我来说非常重要,因为我认为我的语气和语言清晰度都有了很大提高。聊天机器人对用户的语气和发音非常敏感。”

2. 通过音频回答提高听力技巧。由于聊天机器人同时以音频和书面文本的形式提供文本,这一事实使情况变得复杂。评论包括:“我可以自己练习说中文,但如果我一个人练习,我不会得到回应。但是,聊天机器人确实会做出回应,甚至会提出问题。我可以同时练习口语和听力。”“这对我的听力很有帮助,而且可以选择让它重复一遍也很有用。”“我在阅读方面有了明显的进步,所以有时我只会阅读它所说的而不是听它。”

3. 阅读、认字和打字也得到了加强,尽管它们不是研究项目的主要重点。“当我进行文本输入聊天机器人练习时,我开始练习打字和识别汉字。我喜欢聊天机器人有这么多功能。”“虽然这不是我在使用聊天机器人时关注的主要内容,但我喜欢在阅读单词时跟随它们,这有助于词汇/字符的坚持。”“我必须同时阅读和聆听,这有助于我理解我正在阅读的内容。而且我必须擅长打字才能跟上对话。”

未来发展方向拥抱人机交互

学生们赞赏聊天机器人提供了无限的练习机会、更少的压力和更少的判断力。然而,学生们还建议,如果聊天机器人在重音识别方面有类似人类的互动、纠正性反馈、更多样化的主题以及更少的技术问题,它们可能会表现得更好。尽管完全认识到聊天机器人的权衡,但学生们仍然接受了这种新的学习模式。

人工智能聊天机器人不仅可以成为外语学习者的有用对话伙伴,还可以成为远程学习的强大工具。但是,与当前聊天机器人的交互质量仍有提高的空间,这也是研究项目中所遇到的三个如下问题。

一是不必要的重启和添加的回退意图。根据研究团队的观察,Husky C-Bots 有时会在收到一些无法识别的尝试后停止处理,迫使学生从头开始重新开始对话。这浪费了时间并使学生感到沮丧。为了减轻这个问题,该团队修改了聊天机器人,要求用户再次回答问题,以避免不必要的重启。

二是暂停问题和可能的解决方案。当第二语言学生使用聊天机器人练习时,他们往往会在句子中间停顿。但是,Google Dialogflow 默认识别器会自动提交未完成的消息。为了解决这个问题,该团队建议用户安装名为 Voice in Voice Typing 的谷歌 Chrome 扩展程序,它将语音转换为文本,以帮助在提交到聊天机器人之前完成他们的语音消息。

三是重音识别的挑战。根据学生的反馈,Husky C-Bots 部分无法识别带口音的语音可能会阻碍语言学习者。有时,Dialogflow 的默认语音转文本 (STT) 识别器甚至无法理解母语人士的意思。例如,当终端用户说简单的中文单词时,比如“第10课”,由于STT识别错误,聊天机器人有时会误将这个短语识别为它的谐音“When” 。因此,低 STT 识别准确率可能会阻止最终用户有效地练习聊天机器人。

为此,研究团队一直在探索两种可能的解决方案来改善重音语音识别。首先,语音识别输入工具 (VRIT) 通过在将用户的单词输入到基于 Google Dialogflow 的聊天机器人之前过滤用户的单词来帮助识别语音。在这项研究中,一组录制的来自非华语人士的多口音语音被用来测试 VRIT 的识别准确性。其次,研究团队一直在研究是否可以通过构建自己的机器学习 (ML) 模型将其集成到 Dialogflow 中来提高准确率。该团队一直在通过输入外国口音中文语音样本的数据集来训练模型。例如,团队可以调整他们的参数,将音频波形从音调更改为低音调,这更好地类似于英文重音中文语音样本的特征。一些最先进的增强工具允许团队通过合成重音语音数据集来增加他们的训练数据。

最后,论文还明确了中文聊天机器人的未来发展方向。在渐进式行动研究期间,该团队一直在收集美国学生在与中国聊天机器人交互时生成的重音 STT 识别错误数据集。该团队将继续使用这个不断增长的数据集训练定制的 ML 模型,以查看在不久的将来是否可以提高重音 STT 识别准确率。此前,为了更多地吸引学生,该团队曾尝试将他们的聊天机器人整合到由台湾跨国计算机公司华硕创建的实际混凝土机器人 Zenbo Jr. 中。为了更加灵活、兼容和环保,该团队进一步计划开发自己的能够响应对话流的虚拟人形面孔。

图片1:科研团队与华硕AI部门视频交流会议。(蔡安教授供图)

图片2:中文聊天机器人Husky C-Bots 。(蔡安教授供图)


中美创新时报网