第(1/3)页 “众所周知,人工智能的学习训练是需要大量的数据的,只有从大量的数量训练里面,人工智能才能总结出规律和特征。”陈神说道。 “这也是为什么人们说人工智能学习是举百反一的原因。” “但是,在国内语言训练资源的分布是非常不均衡的,国内百分之九十以上的训练数据都是中英对照训练,其他语种的训练数据是非常欠缺的。” “而想要用少量的资源训练出一个优秀的算法模型对于国内外的友商来说,都是非常困难的。” “这也是为什么国内中英翻译的质量和数量远远超出其他语种的原因。” “但是各位应该都很清楚我们的优势在哪里……” 说到这里,陈神看向会议桌上的众人,大家都不约而同地露出了笑容。 用少量的资源训练出一个优秀的模型。 这种事情还有比他们更擅长的吗? 白泽算法分分钟就可以教各位友商做人。 陈神做了一个简单的总结:“目前我们需要解决的就是第一和第二个问题,第三个问题反倒是我们拦住竞争对手的一面铜墙铁壁。” 接下来,陈神拉出一面白板,开始在上面写写画画。 众人一开始还不知道他在干嘛,直到陈神写完上半部分,开始写下半部分,他们才发现了其中的端倪。 “这是……” “这难道是解决前面两个问题的技术思路?” 一个李军请来的AI翻译专家托了托自己的眼镜:“这好像是一种特殊的编码器和解码器思路!?” 在传统解决这个方法的思路里面,是用编码器对词句进行双向编码,大概可以理解为AI同时从需翻译词句的前面和后面开始阅读,并进行编码,最后再由解码器把编码解码,产生出翻译后的句子,并把结果输送出去。 这样面临之前看书的问题时,AI就可以知道在看的是书,而不是其他的东西,进而提高译文的速度和质量。 而在陈神现在写出的思路里面,这是一种全新的编码器和解码器结构。 这种编码器结构极其复杂,但是可以看出它会全面考虑需要翻译的文本,并且计算它们之间存在的联系,输出对应的结果。 陈神在前面写着,一块板不够,就换另一块,李军他们本来就打算在会议之后进行一次讨论会,现场白板数量足够。 第(1/3)页