陆启倒没骗人,他真去洗澡了,虽然可能不算严格意义上的洗澡。
他需要让自己脑袋清醒一些,跑到卫生间,反正这时候这层楼也没别人,全身上下脱了个干净,用毛巾接着洗手池的自来水就往自己身上浇。
降温确实可以使人冷静下来,随着黏黏糊糊的汗水被冲走,陆启最终捕捉到的是“语音”这个词。
他必须要做一份“差异化”的方案才有拿下云信的可能,而现在这个关键的亮点终于被他找到了。
感谢萧小姐的友情援助,让他刚才注意到了“语音”这个点。
魔核项目二组是一个应用类a项目组,他们目前在应用市场中下载量最高的a是一款叫做红豆阅器的书城阅读类应用,公司正门口作为形象展示摆设着的两台手机和平板电脑,上面安装着魔核科技所有研发的应用和游戏,而陆启恰好试用过。
这款a的最大卖点之一便是朗读听书功能,这不是重点,重点是魔核和国内目前最顶尖的专业从事智能语音及语言技术研究的企业之一,也是最大的智能语音技术商汇讯科技一直保持着良好的合作,对汇讯sdk软件开发工具包的使用也相当熟练。
那么在游戏里加入语音功能,在保证识别率的基础上,非常契合他所定位的目标用户,那些大哥大姐,大叔大妈们。
不仅如此,再往深一步想,这甚至不仅仅是斗地主这款游戏本身了,完全可以延伸出云信自己深度定制的语音助手
美国盖亚,韩国银河,rb德拉尼这些世界知名手机品牌在他们的中高端机型上都配备了自家的语音助手,这也被看做是自主研发实力和成熟品牌的象征。
云信手机为什么不呢作为第一款完全平民化附带语音助手的手机,无疑将会巨大提升自身的品牌价值。
陆启甚至连语音助手名字都想好了,小云同学,简直亲切到零距离。
这做个游戏,还附赠一个具有战略意义的应用,哪怕以后云信在手机之后继续推出什么智能硬件,智能机顶盒,智能光猫,智能音响完全都可以应用上。
简直就是打造云信语音生态的源点。
云信凭什么拒绝
完全不在意自己打一份工操着两份心,陆启越想越精神,越想越兴奋。
几乎忍不住要光着身子在洗手间里手舞足蹈起来,恨不得现在立马就天亮,等威猛一来上班,立马拉着他去二组询问这个方案的具体可行性。
威猛如同往常一样,早晨被闹钟叫醒,一边穿衣服一边闻着香味儿走到餐厅,爱人已经为一家人准备好了早餐,这么多年了他还是最爱媳妇儿这一手汤面。
洗刷完毕,再开车把儿子送到就读的小学,临别时嘱咐他要好好听老师的话不许调皮,还佯装生气说“怎么今天没跟爸爸说再见啊。”
然后才沿着绕城高速驶往公司。
刚买三个月的新车,想想也有些唏嘘,在陵城打拼了十三年之后,他才买了自己人生中的第一辆小车,虽然低是低配了点,但好歹也是四个圈儿的车标,开出去面儿上有光。
早前也并不是买不起,只是英年早婚的他更多还是得先考虑家庭,车子并非刚需,房子才是。后来孩子出生,又是一大笔开销,如流水般止不住。一个小家还总得有些存款,买车的计划一年接着一年地搁置,直到三个月前才有了“闲钱”把原来的小电驴给淘汰。
威猛缓缓地将车驶入科技园的地下车库,这几个月他有时候想起来都会心情舒畅,老婆孩子,有车有房,人生如此,夫复何求啊。
咦怎么有人站在自己车位上,那是自己的车位吧没错吧。
威猛远远看着前边儿站着个人,心想这不行,这是公司给他租的长期车位,又不是那些临时的,得叫他让开。
嗯那人好像朝自己方向跑了过来
来着何人不用想,正是陆启。
威猛也认出了陆启,状况外地摇下车窗伸出脑袋“你咋到这儿来了”
陆启径直走到副驾驶敲了敲窗示意威猛解锁,然后打开车门直接就钻了进去,一副没时间解释了快开车的架势“猛哥,带我去汇讯。”
“啥意思啊,嚯,你这黑眼圈。”这凑近了威猛才看清陆启的脸“你这是睡还是没睡呐,黑眼圈这么明显,但又精神成这样,活蹦乱跳的汇讯,你说汇讯语音啊”
“对对,我刚跟汇讯那边的人电话聊了下,我的方案完全ok,但细节需要和他们当面沟通。”
威猛现在是彻底蒙圈了,比刚才还懵。
啥方案啊,沟通啥啊
陆启只能竭尽生平所学,将所有的信息以极度精炼的语言传达出来。
原来昨晚陆启完整地把游戏中增加语音输入的系统流程给过了一遍,然后确定了只要在识别准确率上得到保证,那么这个方案完全可行。
早上六点,他在公司通讯录上翻到了项目二组经理李贺然的电话号码,觉得至少现在打过去比半夜吵醒好,就当提前了一个多小时的叫醒服务,都是为了公司嘛,抱以事后再赔罪的心态打了过去,询问到负责汇讯sdk接入的程序员的名字。
然后又打给那程序员,在那位程序员大哥还云里雾里的情况下,电话里沟通了部分相关技术细节,但因为对sdk有全新需求,所以还得和汇讯那边的技术人员协商,并得到汇讯公司相关人员的电话。
接着又与汇讯集成事业部的程序王敢先连线,得到了方案可行性上比较肯定的答复,但更多细节需要当面沟通。
这时已经八点了,四组也有人来上班了,陆启问到了威猛平时抵达公司的时间和车位,就跑地下车库来等他了。
至于为啥要找威猛这毕竟是公司间的合作,他一个小策划哪有权限搞这些事情,还得要项目经理出面,达成正式的项目合作意向以获取技术支持。陆启也不清楚魔核和汇讯目前合作的细节是全方面的还是就二组那一个项目,说不定还得商务部拟定合同后面一堆乱七八糟的事情,这份心他操不了,只能威猛来。
威猛一愣一愣地总算是明白了大概的意思“语音输入”
“先出发吧,咱路上慢慢说。”陆启硬气道。
威猛倒车,掉头,突然想起“我还没打卡呢”
“你一项目经理打卡不是一句话的事儿吗。”陆启摆手“快走快走。”
汇讯科技的总部就坐落在陵城,离城南科技园也就十来公里的距离,都是本地的互联网企业,不同的是,人家有自己的办公大楼。
在汇讯大厦14楼的会客厅里,王敢先和另一名技术员秦慧明接待了陆启和威猛。
在亲切友好的氛围中,双方就语音助手和自定义关键词这两个议题展开了热烈的讨论。
前者沟通很顺利,语音助手无非就是三个步骤,语音识别,分析指令,执行指令。
就是首先听到你说了什么,然后理解你想做什么,最后帮你把事儿给办了。
第一步完全不需要魔核操心;
第二步汇讯已经有现成的车载系统模版,可识别导航,天气查询,播放音乐等指令,甚至还集成了五种不同的发音人音色。在这基础上定制手机系统指令即可,比如sdk暂时中没有的拨打电话指令;
至于第三步是最简单的,调用手机操作系统ai执行而已,魔核的程序完全能够胜任。
清晰明了,双方一拍即合。
然后是游戏部分,陆启滔滔不绝,手舞足蹈,说的口干舌燥。
不过他现在的形象确实有点让人不敢恭维,明明本来也是一风度翩翩小郎君,现在一脸油光,胡渣唏嘘,头发还死死地贴住头皮,整得跟刚从难民营里跑出来似的。
王敢先和秦慧明也是经验丰富的程序员了,他们为很多公司都过技术支持并与对方的策划对接,就在这屋里聆听过数十名策划的需求,但这是他们第一次见到有人把端上来的水喝完还要续杯的。
“我举个例子。”陆启起身往身后的白板上写下一个“q”,用笔指了指道“这是扑克牌中的q。”
他一边说一边写“有的人管他叫圈儿,有的人管他叫皮蛋,也有的人也读q但发音不太标准咱们的语音识别系统可能会识别成秋或者扣。”
好家伙,这就“咱们的语音系统”了。
白板上又多了“圈儿”、“皮蛋”、“q”、“秋”、“扣”这么五个词。
陆启讲这五个词依次画上箭头,全部指向原来的那个“q”,转身面向三人“我希望我们无论识别到这五个词中的哪一个,都会自动映射为q,作为最终的输出结果。”
三人点点头,他们明白了陆启的意思,这个很好理解。
陆启继续道“我把这个叫做关键词识别,刚才几个就是关键词。我知道语音识别技术目前的难点在于连续语音和海量词汇识别。”他抬头征询了一下王敢先和秦慧明的意见,见两人点头认同便又继续道“但这个游戏项目完全相反,这是独立的关键词加上完全封闭的环境,只有识别到游戏本身相关的关键词才做出反馈,其他内容则直接略过。”
“比如玩家说小老虎,无论是识别成功还是识别不准确变成了小脑斧或“小老夫”都没关系,因为这里边儿没有关键词,咱们压根不反馈。”
“请问有电脑吗”陆启从背包里掏出一个u盘。
秦慧明很快从办公间搬过来一台笔记本电脑,陆启插上u盘,点开了一张流程图和一份表格文档。
“这是整个语音识别流程的流程图。”
陆启将流程图放大,其实并不算很复杂,也就二十多个判断节点,但将整个流程的逻辑梳理得非常清楚,从用户语音输入,汇讯系统语音识别,判断是否含有关键词,最终根据这些关键词选出各种牌型的过程展示得一清二楚。
在场的除了陆启又都是程序员,一看便了然于胸。
“这个并不复杂,我们的接口只要稍加改动就行。”王敢先略加思索道“这个其实主要不是我们这边的工作量,主要是你们自定义的关键词表是不是能够涵盖尽量多的用户说话习惯。”
“对头”陆启打了个响指,然后切换到那份表格“这是我罗列的所有关键词,不多,目前我想到的有”陆启将表格下拉看了眼“784个,但这个需要我们那边自己就可以编辑直接放到游戏里,因为我后续肯定还会往里面增加不少内容,主要是用户说的东西你们识别成什么,我根据识别结果加进去。”
784个,乍一看似乎有点多,但比起我们平时说话的所有用词,简直沧海一粟,保持在这种三四位数的量级,语音识别准确率将会提升非非非非非常多。
几个人凑前一看,好家伙,一堆什么“对钩”、“尖顺子”、“大鬼”、“王炸”、“四个八”还有各种中文加英文字母的组合,看起来简直像乱码一样的东西。
威猛像重新认识了一遍陆启似的“这些东西是你昨晚一晚上弄出来的”
“是啊。”陆启又端起水杯,得,水又没了。
王敢先和秦慧明听见也是一脸难以置信的模样,互相对视了一眼,都听到了对方咽唾沫的声音。
一晚上难怪看这哥们儿的样子就是刚通宵过,但一晚上就弄出来这些,这都什么工作效率啊,魔核哪儿找的这位,也忒猛了点儿吧。