d******e 发帖数: 2265 | 1 Repustate向世界各地的企业和组织提供文本分析服务。随着公司的发展,他们每天处
理的文本段数量从5亿增加到10亿,其中包括Tweet、新闻文章、博客评论、用户反馈等
。大规模的文本分析非常困难,因为很少会出现两段文本完全相同的情况,所以无法利
用缓存来提高效率。不过,它可以将大段的文本分成多个句子,然后并发分析每个句子
。近日,Repustate官方博客发表了一篇博文,介绍其API的演进过程。
Repustate API的第一个版本是用Django编写的。他们构建了一个原型,并以此为基础
推出了他们的服务。但每个Django请求/响应周期的开销太大。随着API访问量增加,可
靠性问题凸显,使用Amazon服务的成本也大大增加。于是,他们开始寻找一种Python代
替方案,并选择了Flask。Flask几乎是现成的API,而且是轻量级的。不过,他们稍后
又发现了Falcon。他们非常喜欢这个框架,因为它使用Cython进行了优化,速度比
Django要快许多,而且它还遵循简洁REST原则。事实证明,Falcon是一个很好的补救方
案。Repustate的平均响应时间缩短了,故障和支... 阅读全帖 |
|
w***g 发帖数: 5958 | 2 看了眼demo,似乎很简单啊。这种东西难道也能卖钱? |
|
|
l*********s 发帖数: 5409 | 4 楼主开个startup吧,然后招我做小弟吧 :-) |
|
|
w***g 发帖数: 5958 | 6 就是这么回事。先拉来生意再搭系统不迟。
可惜我不会拉生意。
等我过两天做一个集图像分析音频分析文本分析于一体的service大家玩玩。 |
|
s***o 发帖数: 2191 | 7 你可以跟老赵合作一下。我觉着他的忽悠能力是本版最强的。
等你们赚了大钱别忘了给我写张支票。 |
|
k******t 发帖数: 1498 | 8 也不用这么贬低技术。他们肯定有某些在外人很难看到的地方有独到之处,有他们独特
的产品设计和技术实力,但肯定不是世界性的难题就是了。 |
|
S***s 发帖数: 104 | 9 If you can make a fairly good service as described,
try find a very good business dev partner who know how to attract VC fund |
|
|
e********2 发帖数: 495 | 11 stiff system and numerical sensitivity |
|
|