找找看小说网【www.shcflt.com】第一时间更新《重生之只争朝夕》最新章节。
别率越高的输入法对技术要求就越高。尤其是侯世达对六耳输入法并不满足于实现整句输入为止,而是必须在整句输入的前提下能够实现至少95%的首次输入正确率。
如果只是打出拼音来,然后判断每个词的组成,最后用几个词语组成一句不通的句子,那用微软的智能abc就能做到,用户不过多敲打几下空格而已。但要做到整句输入,就是要让用户一次输入整个句子,一气呵成。让后面的词语能够根据前面的内容、语义进行自动关联,这种对数据的要求,是传统表型数据无法提供的。
人类对语言的处理过程,不是二维结构,而是一种空间坐标形式存在的。要想让计算机实现人类的“联想”能力,就要让数据像人类处理知识一样,具有进行空间排列。若想能够对数据进行分析、归类和查找,就要知道人类的脑海中知识是如何存在的?归根结底,是一个个神经元中的电脉冲。而神经元肯定不是二维结构,而是所有脑细胞组成的三维结构。
一个神经元被激活之后,会向它附近所有的神经元发射一束电脉冲。一个神经元发射的电脉冲不足以激活另一个神经元,但如果一个神经元在一个单位时间内有多个电脉冲抵达,那就会被激活,这就是人类思考的过程。
智能输入法中用户输入的每一个词,都会向后面的其他词语添加一个阈值。当后面某个词的阈值突破临界点之后,就可以进入备选的范围之内。而这个备选数据库,就是解决信息爆炸问题的关键。因为它是一个三维矩阵形式的数据库,通过knn近邻算法,就能实现非常高的选择准确率。
尤其是通过这种算法,还能对词库里没有出现过的新词,经过几次训练之后就实现机器学习。这一点对无法穷尽人类词语的词库来说,意义特别重大。
然而这些侯世达的同学们,谁也没有想过原来数据还能有三维的组织形式!这对他们来说,不啻是打开了一扇新天地的大门!
不仅是下面的同学们听的目眩神迷、如痴如醉,就连周青山身边几个高材生,听的都目光炯炯有神。
或者应该说,正因为他们都是学校里的高材生,对侯世达说的这些理论上的东西,理解的反而更加深入!
虽然侯世达说的真就是“泛泛而谈”,并没有对这些原理在软件上的应用方式多说。但在场的所有专业同学,都能在冥冥之中感觉到,这些知识将开启一个新的时代!
哪怕是平常上课的时候,再怎么不老实的学生,这时候都在全神贯注的听讲。如果在场的有他们的专业课老师,
找找看小说网【www.shcflt.com】第一时间更新《重生之只争朝夕》最新章节。
本章未完,点击下一页继续阅读。