英语趣配音创始人谭美红:AI外教的未来已来
基于AI外教,英语音创解决英语学习口语输出。趣配
来源|多知OpenTalk
整理|张蔚斐
摄|张蔚斐
在多知OpenTalk第45期“AI如何引领教育走向新纪元”活动上,始人江津市某某软件售后客服中心杭州菲助科技有限公司创始人谭美红分享了英语教育行业与AI的谭美碰撞和思考。
从线下英语口语培训学校做起,外未已谭美红十一年前就将目光看准了在线互联网教育,英语音创这十一年里,趣配菲助科技推出了众多产品,始人包括少儿趣配音、谭美英语趣配音、外未已汉语趣配音、英语音创日语趣配音、趣配Lingodub和西瓜单词。始人去年,谭美又推出了AI外教,外未已核心是外教对练口语的学习场景。
做了这么多产品,菲助科技背后有什么样的底层逻辑和思考?
谭美红表示,语言学习仅仅做好输入环节还远远不够,输出同样重要,AI外教的出现,正是英语口语输出补全的一块重要拼图,基于AI的能力,可以充分利用以下七大优势:
7天24小时可用性、更优的个性化学习体验、更强的即时反馈、适应多样化学习需求、更高的隐私和安全性和更高的成本效益。
以下为谭美红分享原文(经多知编辑):
01
语言学习=(输入+输出)*时间
我们自己认为,语言的学习包含两个部分,第一部分是大量口语输入——各类爆火大V,尤其是启蒙类,所做的就是多磨耳朵、多看动画片,背后逻辑就是要有大量输入。第二部分则是输出环节,真正能讲好流利的英语还是需要有输出的环节。
国人英语学习常见的痛点是,过去十几年的江津市某某软件售后客服中心时间,考了四、六级,读了大学甚至考了专八,但是英语口语就是讲不好,还是哑巴口语。怎么办?核心就是少了输出的关节。
12年前,我开的第一家线下学校叫ishow国际英语,这家学校当时在湖南衡阳是做真人大班制授课,1对40,1个老师上面讲,40个学生在下面听。老师输入环节很不错,但是如何做输出?当时我们做了一个动作,就是把大学里的留学生以及大学里的外教老师请到我们学校来,做1对40的大班制授课或英语角的形式,主要给学生提供一个输出的环境。当时,大家对中国普遍的四、五线城市的外教资源的感观就是参差不齐,留学生来自非洲,他们英语口语不是很好。
当2013年移动互联网的浪潮来临时,我们开始思考,能不能给每一个学生匹配一个真人外教?线下的成本非常重,于是,我们想基于在线的方式给学生提供。
所以当时我们做的第一个项目就是到菲律宾外教基地招聘外教老师,培训外教老师给线下学生提供1对1的输出。当时做这个跨度太大了,后来这块业务给了我们的合作伙伴,所以我们公司名字叫做菲助,就是菲律宾助理。
尝试做真人外教的过程中困难重重,但是我们还是不死心,还是想围绕语言学习输入输出的闭环给学生提供好的教学结果。过去10年的时间里,我们做了4次真人外教的探索,结果都因为我们自己不擅长做这方面的应用四次搁浅。
02
AI外教补全语言学习闭环中的输出环节
去年下半年生成式AI爆发,我们感觉这是非常符合我们自己的团队理念的机会。“如果我们赶不上这波AI浪潮,就会错失这样一个时代”。
当时我受到AI的震撼非常大,有一个朋友去金山做副总裁,负责的是WPS板块业务。我去年3月份生的小孩,他来看我时提到他们内部开会的时候都会说,你自己的工作中哪些部分用AI方式降本增效了?如果几个星期你都没有提到跟AI相关的内容,这个人的位置可能不保。WPS这样大的公司都极其注重AI,何况我们这样类型的小公司呢?
所以,我在去年4月份就做了一个基于生成式AI的产品,叫做AI外教,上线后用户的反馈非常积极,也给了我们很多正向的激励。
过去5年时间,我两次去到北欧做游学,考察那边的幼儿园、小学、初中和高中、大学的学校,跟家长、老师以及大学教授做了一些交流和沟通。主要沟通的点围绕是语言学习层面。
对于一个中国的语言学习者来说,到底以怎样的方式才能讲好一口流利的英语,围绕这个切入点,我做了很多交流。
在芬兰,孩子要掌握的语言是3+1模式,包括芬兰语、瑞典语、英语加一种小语种;丹麦是丹麦语、英语加一个小语种;瑞典是3+1模式,瑞典语、英语、母语课再加一种小语种。
我在北欧跟老师和家长交流的心得是,因为他们的国土面积特别小,人口特别少,芬兰和丹麦总共人口才五、六百万,如果要自己拍一部电视剧或动画片,所耗成本是非常大的。所以他们自己轻易不拍摄,基本都是用欧美国家拍摄出来的素材给孩子直接看,看纯英文的动画片和纯英文的新闻。他们在语言学习过程中是非常轻松简单的,就是顺带把英语学习掌握了,学校教学过程中也是用纯英文方式上课,非常简单。
所以基于这个原理,我们整体打造了一个学习的闭环,就是英语趣配音。通过看动画片给学生1到2分钟的台词时间进行配音,过去十年的时间承蒙老师和学生的喜欢,平台累积了1.6亿学生。
面向输出的环节,过去四次真人外教尝试受阻,这次基于生成式AI,我们终于可以用AI外教给用户做英语输出的练习。
03
AI外教相比真人外教有哪些优势?
它有多个核心优势,第一,它可以做到7×24随时随地的状态,这对真人外教老师是非常难的,就连自己的爸妈都很难做到。
第二,AI外教的个性化学习体验非常优。它可以根据学生学习的薄弱项给予针对性的建议,这是AI非常擅长的。
第三,它的及时反馈性非常强。
第四,它非常适合根据学习的多样性给到相应类型的建议,做学习的规划。
第五,它的隐私性和安全性非常高。学生更愿意把秘密告诉给虚拟形象,如果是真人,没有极强的信任感,学生不敢把自己的小秘密告诉他。
第六,对于普通大众家庭来讲,它成本收益率非常高,可以花很少的钱,得到大量服务训练。
我们认为,AI外教跟真人外教相比,优势是有七高:高科技、高性价比、高陪伴、高水平、高情商、高智商和高个性化的对比。未来一定是人机配合的时代,也是自适应学习的时代。
AI外教产品的基本形态核心主要外教老师,平台有10个AI角色,可以选择英音和美音,可以是真人也可以是IP的角色人物。整个平台里面覆盖六大主题、200多个主题场景训练。除了涉及到类似于考试教材、校园情景以及生活主题相关类型,也会基于我们跟哈佛教育的情景课核心对标CEFR等级一年300多节课让学生进行练习。
另外,我们也会提供给相应的口语备考工具型产品。比如及时纠音、语音通话和智能生词本,主要围绕着语言学习的输入、输出环节进行。
以一个具体的用户使用场景为例,这个6岁左右的小朋友,英语水平非常好,他分不清楚AI外教Peppa是真的还是假的,但是他跟Peppa聊的非常开心,他已经把它当成学习的学伴角色了。
另外,AI有很强的思辨能力,如果父母有很强的思辨引导的话,它的知识储备量会超过想象。我们为什么坚信AI对语言学习者来讲非常友好?过去,我自己在菲律宾招聘过外教,虽然外教的服务态度很友好,但我们很难跟外教展开思辨,因为每个老师的文化底蕴、知识储备量都不一样,能给学生输出的内容也不一样,但AI在这方面的能力很强。
在过往学习过程中,没有生成式AI之前所有学习都是写死的状态,但是AI的加持,让学习的可变性增强很多。
04
AI让教育公平成为可能性
做AI外教产品有点误打误撞,我们的核心是做To C端的产品,英语趣配音是一款To C的产品,由众多老师给学生录制作业,学生到平台上完成作业。这款产品上线后得到了很多公立校和外国语学校的认可。现在国内很多学校都愿意拥抱当下的新技术,AI出来后,学校就在市面上寻找AI练习的产品,找到了我们。
合作学校的老师开始试用AI外教,作为整体课堂中的一堂课给到学生进行练习。虽然是外国语学校,有三、四十名外语老师,但是老师数量还是少,他们期待学生的口语输出可以做的更好,所以找我们做这样的合作。
我们公司的理念是让学习更有趣,让教育更公平,AI让教育更公平成为可能性。
我自己来自于湖南的一个小山村,我读书的时候,英语启蒙是由刚刚毕业的大学生老师教的,但是很多孩子没有优秀的英语老师给他们做启蒙教育,所以我们想借助国外的优质互联网资源,能够传递给四、五线城市的孩子。
在过去十一年的探索里,英语趣配音已经打好了基础,做好里输入环节。这一次,基于AI,我们一定能把输出环节跑起来。我们唯一需要去做的就是基于基础建设,在教育赛道里做更深度的算法定制,包括Prompt定制,教研定制。让教育更公平,我觉得AI是可以真正实现让普通教育家庭花少量钱就可以请一个AI外教老师帮助学生进行口语训练的工具。
未来已来,AI未来。这是我今年3月份体验了VR眼镜发布后的感受,它现在是1.0版本,但是我觉得特别酷,我相信它未来再迭代几个版本会更好。
未来,我们也希望将我们的产品植入到其中,生成一个可动的虚拟的人,实时进行相应交互。比如我们今天的OpenTalk,可以更加身临其境。
也有人问,AI时代到来,是否意味着语言学习没有机会了?不需要学外语了?我认为,如果面向未来做深度的研究以及深度的文学探讨,去了解别人的文化,语言学习尤其英语学习会变得越来越重要。
我们的技术负责人也有过这样的疑惑,技术出身的他们相信技术可以改变一切。但今年4月份我带他们去北欧切身感受,虽然我们可以带一只翻译笔进行沟通,但总是缺少了那股味道,想要了解其他国家更深层次的文化,拿翻译笔作为第三者传译的过程还是有些尴尬。想要走向全世界,英语能力肯定是越来越需要的。
05
Q&A
提问:谢谢您的演讲。非常认同您说的在AI和语言学习相结合中带来的巨大价值。想问的是,对于您的公司来说,您的产品来说,现在AI和语言结合,现在面临最大的困难的而且是非常有价值的需要解决的问题是什么?
谭美红:谢谢您的提问。我认为,对于很多人来讲,现在大语言模型这么普及了,也可以用ChatGPT了,为什么一定要使用你的AI外教进行练习呢?你们的核心卖点是什么?我觉得,如果你是一个自学能力特别强的人,你用任何材料都能学好一口流利的英语,核心是你的自学能力足够强。这部分人,不到0.1%,对于我们来讲,我们的核心竞争力就是基于大语言模型的基础上,我们打造了垂直赛道口语训练的模型,以及教学体系。
这套课程是我们花了很多钱来搭建的,专门请了哈佛教育学硕士,在国内教英语教学差不多20年,这是我在国内打造的一套体系,第一是基于语言赛道写的一套Prompt,在该年龄阶段应该给孩子输入什么,不应该输入什么?第二个基于教学知识点,在学习过程里可以给他设计什么样的类型课程体系。
第二个点,过去11年的时间,我们1.65亿用户,有80%左右来自于K12,我们平台留存下来来自于10亿+中国语言学习者的语料,我认为这块价值量是非常大的。我们能知道中国语言学习者,学习最大的问题在哪里。反向输入一部分数据给到大数据平台,来申请定制我们自己的平台和用户的课程体系,它们的价值是非常大的。
第三个点,我们这个团队比较接地气,都是做线下英语培训学校出身的,我们也不是说拥抱谁,或者赶这波浪潮,而是基于底层用户语言学习的需求做产品。
提问:您提到咱们定位是K12但是这部分的用户需求差别很大。尤其对于小年龄启蒙阶段的,对AI来说可能它对于处理非常精确的事情会比人做的好,但是处理模糊的事情很多尤其对小朋友是不如人的。AI给语音打分的话,之前我做英语启蒙的时候我对发音内容排序是比较靠后的。语音尤其小朋友没有那么标准的时候不是那么重要。我想了解一下你们在AI打分的时候对这种模糊的是怎么处理的?以及您这个产品,我也试用了很多AI外教的产品,很多他们都是聊大天,这种情况学习状况不好,会造成用户流失,您怎么看待内容聚焦在一个课中对内容精确保护,才能达到很或的学习效果。
谭美红:谢谢您的提问。您问的是两个问题,第一是关于发音的问题。本身英语趣配音核心主打就是配音的学习,所以拆解到最小的要素是音素和发音,我们也内部教研团队做这方面的研究。现在基于生成式AI解决起来要容易多了,我们内部有一套这样的机制,现在也没有说到完美状态,还不断的测试过程中。所以你学完一个作品之后,配完之后会给到你音素级别的训练。甚至也有我们内部现在也有B端用户提供的,就是基于48个音标训练核心要素,内部现在在测。
第二个其他类型产品都是泛泛的在聊,我们的产品是不是也是这样?我们是6大主题200个场景的训练,一定是基于场景里的训练的,你点击主题会有核心关键句型,一定是命中这个关键句型才会得分和相关报告。还有情景聊天,有输入和输出,都是基于产品主题性非常强的。这就是需要有教育体系的投入。所以我们的团队占研发一半以上的资源就是做教育,做产品,做配合调算法的团队就是做这部分的工作。
多知OpenTalk第45期相关阅读:
本文整理:张蔚斐
《教育科技这一年·2022》+《培训行业这一年·2021》+《教育科技行业图谱2022-2023》,重磅发售!套装优惠价169元,闭眼入!迅速点击文末“阅读原文”购买,手慢无!
本文地址:http://wolala.love/html/05e499901.html
版权声明
本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。