|
s*x 发帖数: 3328 | 2 楼主搞理论的,为什么不去 waterloo 啊,那里有个 algorithm&complexity group,
好多牛x老师啊。那个给出最小自动机算法的 Brobozoski 好像也在 waterloo |
|
d*****u 发帖数: 17243 | 3 1.基本的语言学知识(至少知道part of speech, 句子画tree这些)
2.简单的自动机原理,形式语言
3.统计方法的机器学习和模式识别
就这三条 |
|
c*******h 发帖数: 1096 | 4 多了解些基础的东西还是比较有用的,例如说计算机的体系结构是怎样的,
汇编怎么写的,编译器是什么原理,操作系统承担什么功能,语言怎么设计
的,计算模型(有限自动机等)是什么,网络怎么收发信息等等。不一定要
上课才会学得到,但上课本身给你一个机会去学。现在大家太注重计算机应
用,或者就是编程和算法设计,而忽略了计算机“科学”本身。 |
|
D***r 发帖数: 7511 | 5 因学校而异
大部分学校要求以下几门中至少4门:
数据结构,算法,操作系统,体系结构,自动机原理(计算理论),编译原理
但不是学了才录取,而是学了才能毕业 |
|
j**********i 发帖数: 3758 | 6 或者说在UNIX和微软的官司里站在哪一边?
这种选择本身就是一个诱惑,许多人因为自己的EGO太大了,所以拼上了性命。
这个有限自动机的名字就叫Ifight。 i既非digital,又非internet。
I就是me的主格,本来就是个小小的me,去争第一位,就成了I.
Ifight,就是fight for myself, not for truth, peace and love。
fight for my EGO, not for friendship,family, and people in distress。
我根本不在乎用那种系统,很多人和我一样,需要能够专心把自己该做的事做好。
不要跟我讲微软在系统里放了迷幻剂,或者比尔盖茨是个魔鬼转世的诡诈者。
你如果把东西做得像windows一样好,并且价格合理,我也许会考虑购买。 |
|
s*****n 发帖数: 5488 | 7 用不用hmm,几个重要的概念要搞清。
第一,你这个是markov随机过程吗。
第二,阴状态,就是你的自动机的状态啦,看上去就是start, end, A, B在你预测任务
中是不是可以观察到的。
第三,markov model是建立在AB状态集上。
第4, 预测问题时,形式是给出 x1, x2, x3, ...... x_n,来找对应的{A|B}.....状态
序列吗?
第5, 训练数据可以计算出状态概率和状态转移概率。 |
|
f*****w 发帖数: 2602 | 8 为啥一定要有高深的数学啊
Computation Theory 里面 自动机理论啥的有多少高深数学了,但不妨碍这些成为cs奠
基的理论吧
当然这个人的东西我也不懂,值不值图灵奖另说 |
|
f*****w 发帖数: 2602 | 9 为啥一定要有高深的数学啊
Computation Theory 里面 自动机理论啥的有多少高深数学了,但不妨碍这些成为cs奠
基的理论吧
当然这个人的东西我也不懂,值不值图灵奖另说 |
|
r**t 发帖数: 937 | 10 【 以下文字转载自 Linux 讨论区 】
【 原文由 rest 所发表 】
我的一个java程序,在两台机器上测试,配置分别是
双P-IV 2.8G+1G Memory, Mandrake 9.2
P-IV 2.26G+384M Memory(dell sc400),win2K Professional
结果却是后者快了25%左右,大家帮忙分析分析是为什么?
程序很简单,没什么I/O,和自动机差不多的东西。 |
|
j**********i 发帖数: 3758 | 11 【 以下文字转载自 CS 讨论区 】
发信人: jpostsildavi (ID), 信区: CS
标 题: 在C和Pascal的争斗里站在哪一边?
发信站: BBS 未名空间站 (Thu Jul 19 04:00:01 2012, 美东)
或者说在UNIX和微软的官司里站在哪一边?
这种选择本身就是一个诱惑,许多人因为自己的EGO太大了,所以拼上了性命。
这个有限自动机的名字就叫Ifight。 i既非digital,又非internet。
I就是me的主格,本来就是个小小的me,去争第一位,就成了I.
Ifight,就是fight for myself, not for truth, peace and love。
fight for my EGO, not for friendship,family, and people in distress。
我根本不在乎用那种系统,很多人和我一样,需要能够专心把自己该做的事做好。
不要跟我讲微软在系统里放了迷幻剂,或者比尔盖茨是个魔鬼转世的诡诈者。
你如果把东西做得像windows一样好,并且价格合理,我也许会考虑购买。 |
|
c****n 发帖数: 21367 | 12 搞定了... 用python... 就是自己处理一些网站“恶意”的验证很讨厌...
推荐IEWatch + python,应该可以应付绝大部分的自动机编写要求,单个
请求处理长度平均不超过10行。 |
|
j***b 发帖数: 5901 | 13 有没有软件根据一组regular expression可以生成自动机? |
|
g*********s 发帖数: 1782 | 14 如果两个词法单位有共同前缀,匹配的优先级是怎么定的?最长优先吗?
比如:
id [A-Za-Z]+
array id[[0-9]]
%%
{id} { return "ID"; }
{array} { return "ARRAY"; }
记不清有限自动机是怎么处理这种情况了。 |
|
d*****l 发帖数: 8441 | 15 这次温州动车事故,已经有北京的信号设备设计单位道歉了。
估计就是对重启动初始化的情况考虑不够,导致其实现的有限状态自动机模型里面漏掉了
一个极端(极小概率)状态:即备份系统初始启动的时候到底是输出红灯还是绿灯应该由
从被取代故障系统失效之后所发生的情况来决定,确实是挺复杂的,跟Windows重启时候
提示用户到底是“Continue Resume"还是完全重启差不多,机器很难判断的,需要提示。
如果是区间内无车,可以初始化为绿灯,这是最简单最常见的状态;但如果新备份设备
重启
时,区间内已经处于非常站控,在这种状态下就复杂了,得根据区间内有无车辆、多少
车辆
来判决。单单让信号系统刚恢复工作就要判断有无车辆在区间内就够复杂的了。。。 |
|
|
|
T********i 发帖数: 2416 | 18 update和rollback都是一次状态变化。有啥区别呢?
我说过了,这是一个非常简单的状态自动机。
network communication是transaction的一部分。你再仔细想想。 |
|
T********i 发帖数: 2416 | 19 别忘了,买过的票就那么几亿张。
用传统数据库和完全的in memory cache完全能解决。
这些都是外围打酱油的服务器。也就是static content cache。其实不完全static。为
方便记这样叫没错。
我的核心是状态自动机。是处理数亿人的刷屏查询和实时订票的。发给他的请求是验证
和筛选过的。
外围的那些,数据划分太容易了。而我的核心,由于依赖性,必须紧耦合。
这就是我能做别人不能做的。
logging |
|
f****4 发帖数: 1359 | 20 好虫,你到底有没有好好看看人家的设计?不要想当然好不好。
他的单机高throughput只是一个有票没票的自动机。commit log只是为了支持rollback
而已。
他的外围机器用来做这些scale的事情,系统的极限就是网络io。如果用来卖地球上的
沙子,单机放不下;但是火车票和股票就能处理。
所谓
他的 |
|
f****4 发帖数: 1359 | 21 你这个功力还是赞的
我之前的分析是假设goodbug的4数据库分表,每个是单独的数据库。但没理解到
goodbug说的是分布式数据库,具体实现是数据库提供的。
我之前的假设,都是基于4个数据库是单独的数据库,认为这样能缩短排队时间。这样
有些case不再适用,我得再想想。
我们简单点说,排队时间。既然你要分段票买票上锁,你说实现的效率上,是分布式的
数据库快还是一个集中的主机快?更何况集中的主机上如果不上多线程的话都可以不用
上锁。这点我已经分析过了。
我之前的分析排队时间的时候举了个300人排队时间被拉长的例子,现在的情况一样糟
糕。搞不好还要糟糕。
换个话说,魏老师那个集中的出票自动机的实现,给goodbug的这个看似分布的实际概
念上集中的分布式数据库代替了。恩,就是这样。
了) |
|
T********i 发帖数: 2416 | 22 其实数据库是打酱油的。也就是备份一下,还是异步。
计数器可靠性靠串联一串单机保证。同步就是sequenced message log。
想象一个状态自动机,初始状态和所有输出决定当前状态。
snapshot后可以忘掉以前的消息。
我早就说过,其实这是messaging system。 |
|
D*****r 发帖数: 6791 | 23 算吧,了解了之后,就知道compiler背着自己到底本质上在干什么,或者说知道自己到
底在干什么。
有些理论的东西,什么各种自动机啊,正则表达式啊,知道一下好像有帮助。 |
|
T********i 发帖数: 2416 | 24 buffer就是一个concat算法。属于最简单的算法了吧?
其实他说到json。他还要计数左括号和右括号数量才行呢。
这属于最简单的状态自动机了。我对他有信心。 |
|
h**********c 发帖数: 4120 | 25 WATT#%$?
NTM X cartesian trasintion functions = DTM
is this robot engineering? |
|
w***g 发帖数: 5958 | 26 窃以为量子计算机也没法实现NTM,物理世界肯定有某些限制导致这个
不能实现。否则在量子计算机上P和NP就没有区别了。
NP不管以任何方式变成可有效计算的话都是too good to be true。 |
|
T********i 发帖数: 2416 | 27 有人指出了现在的量子计算机能计算一类问题BQP。但是还不能证明BQP===NP。
我个人认为量子计算机理论将来也有可能继续发展。不论如何,量子计算机是更加接近
NTM的。
微信群里面有一个搞数学的号称他的一个朋友找到了NPC的平均复杂度===P的算法。但
是他朋友精神病疯了。他仔细研究朋友手稿看不出毛病。但是又不能代替朋友发表。呵
呵呵。
不管信仰,现实是,NP是不是等于P?谁也不能证明,谁也不能证伪。
我讨论的主要是现在的硬件架构。在这种架构下,如果任何软件的设计不是基于状态机
的,那根本就是设计错误。越靠近状态机的越是好的架构。 |
|
l******t 发帖数: 55733 | 28 这个朋友手里的手稿好像那张祖传花旗银行1945年一亿美金本票啊 |
|
|
发帖数: 1 | 30 分布系统全是基于state machine的。
那个通信系统的软件设计也是,但是很多人都hate。魏老师怎么看 |
|
T********i 发帖数: 2416 | 31 通信系统本来就有这个传统。单核单线程死循环。
分布式系统鱼龙混杂。就不好说了。
很多人hate可能也有一部分实现的原因。但是我想说一句话绝对不会错:要是一个人连
这个系统的状态机都分析不明白,都实现不了,这个人就别干了,直接吃屎去算了。
我发现很多成天把并发挂在嘴边的,反倒是对软件和硬件体系结构毫无概念的。
物理学家的世界是量子的。码工的世界不但应该是量子的,还应该是单线程的。 |
|
a****u 发帖数: 1537 | 32 01才是终极解,谁不同意我就和谁急,然后用机关枪突突突他们。 |
|
|
|
|
h**********c 发帖数: 4120 | 36 WATT#%$?
NTM X cartesian trasintion functions = DTM
is this robot engineering? |
|
w***g 发帖数: 5958 | 37 窃以为量子计算机也没法实现NTM,物理世界肯定有某些限制导致这个
不能实现。否则在量子计算机上P和NP就没有区别了。
NP不管以任何方式变成可有效计算的话都是too good to be true。 |
|
T********i 发帖数: 2416 | 38 有人指出了现在的量子计算机能计算一类问题BQP。但是还不能证明BQP===NP。
我个人认为量子计算机理论将来也有可能继续发展。不论如何,量子计算机是更加接近
NTM的。
微信群里面有一个搞数学的号称他的一个朋友找到了NPC的平均复杂度===P的算法。但
是他朋友精神病疯了。他仔细研究朋友手稿看不出毛病。但是又不能代替朋友发表。呵
呵呵。
不管信仰,现实是,NP是不是等于P?谁也不能证明,谁也不能证伪。
我讨论的主要是现在的硬件架构。在这种架构下,如果任何软件的设计不是基于状态机
的,那根本就是设计错误。越靠近状态机的越是好的架构。 |
|
l******t 发帖数: 55733 | 39 这个朋友手里的手稿好像那张祖传花旗银行1945年一亿美金本票啊 |
|
|
发帖数: 1 | 41 分布系统全是基于state machine的。
那个通信系统的软件设计也是,但是很多人都hate。魏老师怎么看 |
|
T********i 发帖数: 2416 | 42 通信系统本来就有这个传统。单核单线程死循环。
分布式系统鱼龙混杂。就不好说了。
很多人hate可能也有一部分实现的原因。但是我想说一句话绝对不会错:要是一个人连
这个系统的状态机都分析不明白,都实现不了,这个人就别干了,直接吃屎去算了。
我发现很多成天把并发挂在嘴边的,反倒是对软件和硬件体系结构毫无概念的。
物理学家的世界是量子的。码工的世界不但应该是量子的,还应该是单线程的。 |
|
a****u 发帖数: 1537 | 43 01才是终极解,谁不同意我就和谁急,然后用机关枪突突突他们。 |
|
|
|
|
d*******r 发帖数: 3299 | 47 很精辟的帖子,绝大部分都赞同.
针对这个:
"第二, 事件回调(event callback)归根结底依赖于硬件中断(interrupt)。即
使是硬件中断最终也是依赖于高速状态轮询(polling) "
跟我看过的底层代码一致,不过还是想问:
难道计算机最最底层,甚至硬件电路,就没有真正的 event notifiy 这种东西,
都是靠高速 polling 来模拟 event 的? |
|