“俞总,你知道车机语音要推倒重来的事吗?”崔之愚开门见山。
俞兴关掉电脑上的网页,随口答道:“我知道,我听隔壁说了,认为我们这边采用的模型比较落伍,就是那个、那个”
他想了想,抬头问道:“是叫高斯混合模型吧?”
“是的,是高斯混合模型+隐马尔可夫模型的混合架构。”崔之愚认真的说道,“这一套就是大家都在用的,公司也搞了快半年了,怎么能说推倒就推倒呢?”
他昨天充分聆听语音团队的不满和意见,也记住了核心问题所在。
核心问题就是核心没了
俞兴沉吟:“这是之前来临港开会的科学家们的意见,还有一位出自麻省理工的朱博士,他带着团队帮忙搞呢,说是换成一个更智能的架构,叫”
他伸手在文件里翻了翻,翻出来自隔壁的小作业思路,念出核心架构:“是叫深度神经网络dnn,是什么深度置信网络dbn和前馈神经网络,能够重构声学模型。”
崔之愚不满道:“俞总,这也太草率了!他们虽然是专家,但没有深入了解我们的东西,就这样把工作搞乱,我不赞同!”
俞兴放下文件,说道:“让他们帮忙不容易啊,花了1000万美元呢。”
崔之愚闻言,大吃一惊:“1000万美元?就干这个活吗?这”
他痛心疾首:“这钱不该花啊!”
崔之愚就差大骂俞总是败家子了!
俞兴淡定的说道:“不是碳硅集团出钱,是隔壁碳硅数据出的钱。”
崔之愚嗓子眼的情绪缓了缓,思虑道:“话说回来,有的钱该花也是要花的。”
他脑子里的念头转了转,1000万美元托请的专家,这所谓的dnn架构,所谓的重构声学模型,或许不是想象中的那么一回事
崔之愚尊重了隔壁兄弟单位的付出,决定收回请愿,暂且观察观察情况。
不过,他没想到这个观察时间会这么短。
仅仅到了第三天,语音团队负责人任逸轩就期期艾艾的再次找过来,心悦诚服称赞了最新声学模型的效果,dnn通过多层非线性变换,直接学习从语音特征到音素的概率映射,代替了gmm的概率密度估计,这与隐马尔可夫模型结合,展现出接近人类专业转录水平的前景。
任逸轩自我检讨:“崔总,我没想到他们这个模型效果会这么好,他们搞