五千年(敝帚自珍)

主题:【原创】围绕脑科学而发生的若干玄想 -- 鸿乾

共:💬461 🌺824 🌵2
全看分页树展 · 主题 跟帖
家园 我的工作是这样的

我写了个程序,程序的目的是“学习词语”,我希望它可以达到2岁左右小孩的水平。

每个神经元都是一串字符,例如 0A,10,0A0B等等。

初始的神经元从00-FF,一共256个。

规则只有一个,拼接:就是把两个神经元的字符拼接在一起去形成新的神经元。

我提供一个训练文本,就是把一段文本用二进制方式输入。

——————————————

程序逻辑是

1、按照神经元权重随机激活一个神经元

2、被激活的神经元去拼接一个未拼接过的神经元并形成一个新的神经元

若新神经元在训练文本中存在,则被激活的神经元权重增加,否则不变。

持续重复以上过程。

——————————————

通过各类不同的训练文本的输入,通过大量的迭代,来观察整个程序的运行结果。主要观察形成了哪些神经元及其权重。

所形成的神经元和训练文本密切相关。

一些不完整的经验总结

1、由于汉字是由2个字符组成的,在全随机的情况下,识别出汉字的时候的概率相当低。但是只要教一个文本中有的汉字(就是预先生成一个2个字符的汉字神经元,并且把权重+1),整个程序的汉字识别概率就大幅度上升。

2、先输入一段中文训练文本,10000次迭代后“学会”中文字词,在此基础上输入一段英文训练文本,经过10000次迭代基本很难“学会”英文单词。

如果是直接输入英文训练文本,10000次迭代后可以“学会”若干英文单词。


本帖一共被 1 帖 引用 (帖内工具实现)
全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河