第741章 文字的特征

“英文的论文就暂时不考虑的,不重复的独立字母只有26个,加上阿拉伯数字数字是36个,没有参考价值。

“我们做的汉字文献单字统计,做了一百多份,结果都在1000个到1400个之间,平均下来是1200个单字。

“样本是足够的,所以基本可以确定,以汉字撰写的文献,在2万字篇幅下,不重复的独立单字平均1200个。

“这和陨石文明的2000个不重复独立单字,有一些差距。不过差距不到两倍,这个差距在外星文字的研究上,其实并不大。

“因此,从出现的独立单字数量来看,陨石文明所使用的文字,和汉字有相似的特征。网首发

“可以初步确定,陨石文明的文字库,应该比汉字大,他们常用的文字数量也比汉字多。

“根据这些文字特征,进行破译,会简单很多。”

方源思索片刻后问道:“要多久才能破译出这些信息的含义?”

“这个还无法确定,由于没有一个基础点,要用穷举法进行破译,难度很大。而且,更困难的是,即便是穷举法,也没有一个标准答案,即便破译出了结果,也无法确定破译的结果是否正确,这才是最困难的地方。”郎同光解释道。

“没有更好的办法了吗?”方源觉得军科院的技术手段,应该不至于此。

“办法当然是有的,可以通过猜测,先确定一部分文字……”

郎同光接着解释:“比如,通过分析,我们已经基本可以确定,陨石文明是所有的文字,和汉字有很多特征相似。

“那么,我们就可以更进一步猜测。陨石文明所留的文献里面,重复最多的字代表什么含义?

“比如汉字文献里面,重复最多的字,一般是‘的’字,第二的是‘是’字。

“那么,我们就可以继续猜测,陨石文明的文字里面,是不是也有‘的’这样的字。

“如果有,重复最多的那个字,是不是就是‘的’,或者是含义相近的字。

“当然这只是猜测,因为汉语中的‘的’是个助词,本身没有含义。

“我们还不能确定陨石文明的语言中,也有这样的无意义助词。

“所以,这个猜测的过程需要进行验证,才能确定是否正确。”

鲁修文接过话头道:“确实,对于外星文字的研究,难度确实比较大。它还不像甲骨文,甲骨文还能通过文字的形状猜测其含义。

“现在摆在我们面前的是一串没有含义的编码,要通过编码的特征猜测文字的含义,难度确实大。”

方源一边思考一边点头道:“确实,不过,也可以先猜测一

相关阅读: 我不想再装修仙大佬了基建从工匠系统开始姜笙司夜爵爵爷娇妻火辣辣姜笙司夜爵开局一只猴进化靠吞噬早安!三国打工人太棒了,我逐渐理解一切陆少,你夫人又翻车了带着系统去修魔黛玉义姐不好当[红楼]炮灰女配靠开箱改命了[娱乐圈]重回国家玩基建!重生之全能辣媳宋三喜苏有容楚尘宋颜夫人她一心求死宋凝乐祁夜[综]残酷世界与软弱的我颜稻花萧烨阳异世界开局全点厨艺斗罗:武魂从曼陀罗蛇开始进化