“这里,尤其是在对于一些产生歧义的词多注意,要联系所在语境以及说话者的语气来综合性判断。
还有让张老师他们加快进度,只有他们那完成了我们才能进行下一步测试工作。”
吴浩边吃着已经有些发凉了的午餐,边冲着邹小东和其他几个技术人员吩咐道。
他话中的张老师他们,实际上是他们聘请的一些语言文学方面的老师和专家所组成的一个语言文学解析项目组。
这个项目组十分庞大,总共有近百位在汉语言文学文化方面比较专业的老师和专家以及年轻专业人才所组成。
当然了,这是一个比较松散的项目组,所有的成员都是临时聘请过来的。他们本身有自己的工作,大部分都是各个学校的老师或者文化研究人员,这只不过是他们的兼职。
吴浩自然也希望能拥有这样的一只专门研究这方面的团队,但以他们目前的条件有些负担不起。而且这些好的语言文学文化专家教授之类的人家本身有自己的正式工作,吴浩很难撬动。
所以才会使用这样一种方式,将这些人聚集起来,来进行语言对话以及词汇理解标注方面的工作。
说白了,其实就是来研究对话语言的。用户说出来的内容,智能语音助手要听得懂,并作出相关的回答。
正常的对话当然没问题,但如果涉及一些较生的词汇或者日常俗语,就不一定能听懂了。
这支团队的作用就是针对这些大量的生词和日常俗语进行标注,并作出相应准确的理解,从而换成智能语音助手能够听得懂的信息。
而且程序不仅仅要听到用户口语化的内容,还要以口语化或者说回答的更加自然。程序本身没有独立意识,它所表现的如何聪明拟人还是技术人员定义赋予它的。
这项工作难度不算太大,但工作量却十分巨大。要知道一个区域可能有一个区域的日常俗语,还得考虑到口音的影响,这无疑增加了工作强度。
以他们现在的能力,也只能做普通话方面,至于方言领域短时间是不会去触碰的,除非真的有这方面的需求或者项目。
如果单纯只是这方面的工作内容,吴浩肯定没法吸引这么多专家教授为他工作。更何况这可都是正经