由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Military版 - 求教大神,智能识别破解甲骨文什么思路? (转载)
相关主题
周人在殷商文字基础上创立了自己的文字 (转载)从AI和阿尔法狗看加拿大藏龙卧虎人杰地灵。
ai就是个泡,管5年论中国的民主超越(原创——请求置顶)
谢国忠: 中国核心的问题是官僚资本主义 ZT (转载)为什么帝国主义是中国的未来
一位外国人20年对中国文字的整理 zt为什么帝国主义是中国的未来?
令中国人汗颜 美国老人开发程序将甲骨文搬上网不裸退的一个好处是有助于保持政策连续性
金文取代甲骨文,是不是灭绝传统文化?韓官籲美關注中國霸權擴展 ZT 明報
从甲骨文进化到先秦文字纽约时报关于中国对抗美国继续关押刘晓波的报道后读者评论
tensorflow基本上就石狗家的闲的无所事事的储备军搞的东西 (转载)穆巴拉克就是人渣啊
相关话题的讨论汇总
话题: 甲骨文话题: 识别话题: 破译话题: 破解话题: 智能
进入Military版参与讨论
1 (共1页)
J*******i
发帖数: 1315
1
【 以下文字转载自 CS 讨论区 】
发信人: Jiuweigui (九尾龜), 信区: CS
标 题: 求教大神,智能识别破解甲骨文什么思路?
发信站: BBS 未名空间站 (Tue Sep 19 13:29:48 2017, 美东)
能做到吗?
J*******i
发帖数: 1315
2
包括类似的其它死亡文字识别
比如 玛雅文, 古埃及文什么的
d*****u
发帖数: 17243
3
你听说过Rosetta stone吗,翻译死文字的一个经典例子。
现在的语言学奥林匹克竞赛经常就有未知文字翻译题。
J*******i
发帖数: 1315
4
这个是语音识别吧?
我没用过

【在 d*****u 的大作中提到】
: 你听说过Rosetta stone吗,翻译死文字的一个经典例子。
: 现在的语言学奥林匹克竞赛经常就有未知文字翻译题。

b*******8
发帖数: 37364
5
这个感觉AI太难弄,因为数据太少了。人处理少量数据,比电脑强。还有人在破译这些
文字的时候,要找大量别的资料,是个开放问题。
J*******i
发帖数: 1315
6
我想要图形图形识别,通过已有人类文字数据库进行比对
然后深层自我学习,达到最后破解未识别文字的目的
b*******8
发帖数: 37364
7
不是语音识别。是拿破仑在埃及发现石碑,两面一面埃及文,一面波斯文,靠认识后者
破译了前者。

【在 J*******i 的大作中提到】
: 这个是语音识别吧?
: 我没用过

c***c
发帖数: 21374
8
还是可以的。
首先文字有联系性。比如甲骨文不少字和金文很像。而金文认出的字要多的多。因此一
下子就可以认出一些甲骨文。
其次语言也有连续性。如果甲骨文里某个字真认不出,但是这个字和某些认出的甲骨文
经常符合一定pattern出现,而那些认出的字在金文中也出现,那么可以根据pattern去
猜。
当然,这要求必须有一定的数量。

【在 b*******8 的大作中提到】
: 这个感觉AI太难弄,因为数据太少了。人处理少量数据,比电脑强。还有人在破译这些
: 文字的时候,要找大量别的资料,是个开放问题。

d*****u
发帖数: 17243
9
是两种古埃及文和古希腊文。
严格说都是死文字,但古希腊文到现代语言的翻译是已知的。
所以这是破译埃及文的里程碑

【在 b*******8 的大作中提到】
: 不是语音识别。是拿破仑在埃及发现石碑,两面一面埃及文,一面波斯文,靠认识后者
: 破译了前者。

w***u
发帖数: 17713
10
Rosetta破解,当年当然是非常牛B,现在看来应该是比较容易的,有一门已知语言做对
照。
相关主题
金文取代甲骨文,是不是灭绝传统文化?从AI和阿尔法狗看加拿大藏龙卧虎人杰地灵。
从甲骨文进化到先秦文字论中国的民主超越(原创——请求置顶)
tensorflow基本上就石狗家的闲的无所事事的储备军搞的东西 (转载)为什么帝国主义是中国的未来
进入Military版参与讨论
w***u
发帖数: 17713
11
当然甲骨文可能也不会太难,活语言的祖宗,不间断的文献。
投入不够,缺乏学科间合作。
d*****u
发帖数: 17243
12
现在的机器翻译模型就是自动学习出来的(加上局部人工调整)。
就是用两种语言的文本去训练一个Sequence to sequence模型。

【在 J*******i 的大作中提到】
: 我想要图形图形识别,通过已有人类文字数据库进行比对
: 然后深层自我学习,达到最后破解未识别文字的目的

J*******i
发帖数: 1315
13
金文,小篆做数据库和学习模型
可以用来破甲骨文。
有这类工具吗?

【在 c***c 的大作中提到】
: 还是可以的。
: 首先文字有联系性。比如甲骨文不少字和金文很像。而金文认出的字要多的多。因此一
: 下子就可以认出一些甲骨文。
: 其次语言也有连续性。如果甲骨文里某个字真认不出,但是这个字和某些认出的甲骨文
: 经常符合一定pattern出现,而那些认出的字在金文中也出现,那么可以根据pattern去
: 猜。
: 当然,这要求必须有一定的数量。

d****o
发帖数: 32610
14
都有文本了,
自己攒一个RNN就行

【在 J*******i 的大作中提到】
: 金文,小篆做数据库和学习模型
: 可以用来破甲骨文。
: 有这类工具吗?

b*******8
发帖数: 37364
15
属实。都是文科生在搞,又被郭沫若老流氓这样的学霸垄断。如果引进理工科技术,应
该能破解更多,不至于现在一大半字都认不出来。

【在 w***u 的大作中提到】
: 当然甲骨文可能也不会太难,活语言的祖宗,不间断的文献。
: 投入不够,缺乏学科间合作。

k*****a
发帖数: 7389
16
怀疑都是瞎蒙的,并没有正确翻译
d**s
发帖数: 4741
17
罗萨塔石碑那么假的东西都有人信?
J*******i
发帖数: 1315
18
哪些证据说明假?

【在 d**s 的大作中提到】
: 罗萨塔石碑那么假的东西都有人信?
d*******y
发帖数: 2710
19
Python, Numpy and Theano
哪个更好?

【在 d****o 的大作中提到】
: 都有文本了,
: 自己攒一个RNN就行

d*******y
发帖数: 2710
20
需要多少人工能开发出来这个东西?

【在 d****o 的大作中提到】
: 都有文本了,
: 自己攒一个RNN就行

相关主题
为什么帝国主义是中国的未来?纽约时报关于中国对抗美国继续关押刘晓波的报道后读者评论
不裸退的一个好处是有助于保持政策连续性穆巴拉克就是人渣啊
韓官籲美關注中國霸權擴展 ZT 明報土共这个指定和原始社会的禅让很像啊。
进入Military版参与讨论
d**s
发帖数: 4741
21
http://bbs.tianya.cn/post-no05-380755-1.shtml

【在 J*******i 的大作中提到】
: 哪些证据说明假?
d*****u
发帖数: 17243
22
总的来说学者比民科可信。
学者的研究方法和结论是公开的,可以去质疑。
古文字研究很难,争议是常见的。
大部分民科则不具备专业知识,但异常情绪化。把任何既有结论视为阴谋,油盐不进很
难说服。

【在 d**s 的大作中提到】
: http://bbs.tianya.cn/post-no05-380755-1.shtml
d**s
发帖数: 4741
23
这些就是洋民科的产物

【在 d*****u 的大作中提到】
: 总的来说学者比民科可信。
: 学者的研究方法和结论是公开的,可以去质疑。
: 古文字研究很难,争议是常见的。
: 大部分民科则不具备专业知识,但异常情绪化。把任何既有结论视为阴谋,油盐不进很
: 难说服。

d*****u
发帖数: 17243
24
那个天涯的帖子我简单看了一下,没有任何技术细节全是空泛的论述。
一般来说,没有细节的“学术”讨论都是垃圾。因为无法evaluate

【在 d**s 的大作中提到】
: 这些就是洋民科的产物
d**s
发帖数: 4741
25
埃及文破译的过程我未深究,但是可以给你讲一下赫梯文的破译过程 “现在吃面包喝
水” 把20世纪高地还是低地德语的发音套到三千年的安纳托利亚半岛上然后就破译了
赫梯文。这才是真正的民科精神。

【在 d*****u 的大作中提到】
: 那个天涯的帖子我简单看了一下,没有任何技术细节全是空泛的论述。
: 一般来说,没有细节的“学术”讨论都是垃圾。因为无法evaluate

d*****u
发帖数: 17243
26
你这个总结精确吗?
利用现代亲属方言并结合音变普遍规律来拟构古音并不罕见。
中古汉语(唐宋音)音系就是这么拟定出来的。

【在 d**s 的大作中提到】
: 埃及文破译的过程我未深究,但是可以给你讲一下赫梯文的破译过程 “现在吃面包喝
: 水” 把20世纪高地还是低地德语的发音套到三千年的安纳托利亚半岛上然后就破译了
: 赫梯文。这才是真正的民科精神。

s********i
发帖数: 17328
27
你这个不叫破译,叫查字典。

【在 b*******8 的大作中提到】
: 不是语音识别。是拿破仑在埃及发现石碑,两面一面埃及文,一面波斯文,靠认识后者
: 破译了前者。

d*******y
发帖数: 2710
28
老郭学医出身,只能说不务正业
但不可说他是文科生
老郭1931年出版《甲骨文字研究》
世界上第一台计算机1942年才诞生
这真不能怪老郭
那时候就这个技术,不能用现在的标准去要求古人
李白要知道现在电脑也能作诗,估计就立志当一名著名码农了

【在 b*******8 的大作中提到】
: 属实。都是文科生在搞,又被郭沫若老流氓这样的学霸垄断。如果引进理工科技术,应
: 该能破解更多,不至于现在一大半字都认不出来。

1 (共1页)
进入Military版参与讨论
相关主题
穆巴拉克就是人渣啊令中国人汗颜 美国老人开发程序将甲骨文搬上网
土共这个指定和原始社会的禅让很像啊。金文取代甲骨文,是不是灭绝传统文化?
我老实验室的老印居然都知道mitbbs (转载)从甲骨文进化到先秦文字
繁体字不会灭绝,作为一种字体会继续保存下去tensorflow基本上就石狗家的闲的无所事事的储备军搞的东西 (转载)
周人在殷商文字基础上创立了自己的文字 (转载)从AI和阿尔法狗看加拿大藏龙卧虎人杰地灵。
ai就是个泡,管5年论中国的民主超越(原创——请求置顶)
谢国忠: 中国核心的问题是官僚资本主义 ZT (转载)为什么帝国主义是中国的未来
一位外国人20年对中国文字的整理 zt为什么帝国主义是中国的未来?
相关话题的讨论汇总
话题: 甲骨文话题: 识别话题: 破译话题: 破解话题: 智能