由买买提看人间百态

topics

全部话题 - 话题: 聚类
首页 上页 1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)
t****a
发帖数: 1212
1
来自主题: JobHunting版 - 程序设计语言启发以及聚类分析图
再贴几张图:
貌似语言发明的越来越快了
p*****2
发帖数: 21240
2
来自主题: JobHunting版 - 程序设计语言启发以及聚类分析图

大牛还在研究尾递归吗?
t****a
发帖数: 1212
3
来自主题: JobHunting版 - 程序设计语言启发以及聚类分析图
Objected-oriented抢了过程式的饭碗
FP貌似缓慢增长,不明显
t****a
发帖数: 1212
4
来自主题: JobHunting版 - 程序设计语言启发以及聚类分析图
type inference逐渐大行其道?
t****a
发帖数: 1212
5
来自主题: JobHunting版 - 程序设计语言启发以及聚类分析图
偶不懂诶,玩了几天clojure的尾递归玩了个大概就算了,前面有人说不能把所有递归
转成尾递归,自己也没玩出来,后来就去搞memoize了,那个更实用些
clojure里iterate函数也很好用,做bfs一行就搞定了。也许其他FP语言也差不多
t****a
发帖数: 1212
6
来自主题: JobHunting版 - 程序设计语言启发以及聚类分析图
memoize:
比如给一个函数f(x,y)要进行复杂的计算,如果把它定义成memoize了的话,程序就记
住了它的返回值,下次call f(x,y)就立即返回结果。
用递归实现DP的时候很有用,因为DP的时候很多子问题是重复的
尾递归:就说背包问题用DP求解,我就不会转尾递归;以及一堆其他的问题比如换硬币
什么的;凡是涉及到在函数里多次call不同子问题,然后在它们的结果上做运算的,我
都不知道该怎么转尾递归。二爷要是有办法请教教我。
我这里说的iterate是一个“高阶函数”比如定义另一个函数f(x), 那么
iterate f(x)会产生一个序列,结果是x, f(x), f(f(x)), f(f(f(x))), ... 这东西挺
有用的。
d**e
发帖数: 6098
7
来自主题: JobHunting版 - 程序设计语言启发以及聚类分析图
你是研究PL的?
t****a
发帖数: 1212
8
来自主题: JobHunting版 - 程序设计语言启发以及聚类分析图
我是感兴趣自己玩的...
d**e
发帖数: 6098
9
来自主题: JobHunting版 - 程序设计语言启发以及聚类分析图
太牛了!
当年上PL课,第一次考试考了个13分。。。
p*****2
发帖数: 21240
10
来自主题: JobHunting版 - 程序设计语言启发以及聚类分析图
memoize:
这个跟FP没什么必然联系吧?我一直这么搞
尾递归:
http://www.mitbbs.com/article_t/JobHunting/32313817.html
http://www.mitbbs.com/article_t/JobHunting/32313551.html
看看这两个帖子我的尾递归
p*****2
发帖数: 21240
11
来自主题: JobHunting版 - 程序设计语言启发以及聚类分析图

PL是什么呀?
t****a
发帖数: 1212
12
来自主题: JobHunting版 - 程序设计语言启发以及聚类分析图
我真的是外行,PL是什么的缩写我都不知道。
上头的数据都是从wiki弄来综合的。
d**e
发帖数: 6098
13
来自主题: JobHunting版 - 程序设计语言启发以及聚类分析图
programming language
我特崇拜懂这个的牛人
p*****2
发帖数: 21240
14
来自主题: JobHunting版 - 程序设计语言启发以及聚类分析图

看来你也是PL牛人呀。膜拜一个。
d**e
发帖数: 6098
15
来自主题: JobHunting版 - 程序设计语言启发以及聚类分析图
我啥也不懂,就是因为学过但什么也不懂,所以觉得学得好的都是超级牛的人
p*****2
发帖数: 21240
16
来自主题: JobHunting版 - 程序设计语言启发以及聚类分析图

PL里边都学啥东西呀?
t****a
发帖数: 1212
17
来自主题: JobHunting版 - 程序设计语言启发以及聚类分析图
呵呵,还不太看得懂,回头再想想。
d**e
发帖数: 6098
18
来自主题: JobHunting版 - 程序设计语言启发以及聚类分析图
归结到底还是数学的东西比较多 (可能也不对,因为我不懂)
我上过的课讲过FP(OCaml),lambda calculus,还有很多当时不理解现在也不理解也忘
清光的东东。
p*****2
发帖数: 21240
19
来自主题: JobHunting版 - 程序设计语言启发以及聚类分析图

大牛说说FP还有哪些点需要重点研究的?
p*****2
发帖数: 21240
20
来自主题: JobHunting版 - 程序设计语言启发以及聚类分析图

数学我贼差了。算了不想了。
t****a
发帖数: 1212
p*****2
发帖数: 21240
22
来自主题: JobHunting版 - 程序设计语言启发以及聚类分析图

有重点吗?
t****a
发帖数: 1212
23
来自主题: JobHunting版 - 程序设计语言启发以及聚类分析图
我是外行,不清楚啊。我自己想学学type theory。
m****t
发帖数: 2329
24
来自主题: JobHunting版 - 程序设计语言启发以及聚类分析图
re
s*w
发帖数: 729
25
N(0,1) 和 N(2,3) 重复的太多了,你不能指望得到准确聚类,有很大 bayes error
在那里的
换个 N(0,1) 和 N(3,1) 先试试
S******1
发帖数: 216
26
来自主题: JobHunting版 - 借人气请教个G题
取每个单词为一个维度,如果有n个单词那每个句子都是一个n维的vector [0,0,1,1,0
...1,0], 定义vector的距离就是都为1的维度的个数,找距离最近的pair.
是不是可以用类似于聚类的算法做近似计算?
G**U
发帖数: 180
27
呵呵,这个就是围城啊……
backend就不是一个平台火三年了吗?
如果做工程,基本就是endless debugging,大公司内部功能类似的系统往往好几个,
相互之间pk,万一被deprecate掉几年辛苦也费了一大半,最多能有点经验积累。
如果做算法,不过就是找feature,run各种分类聚类预测实验,nb一点的会在svm之类
的现成包里面调调参数,绝大多数还是每天做各种数据萃取清洗转格式外加debug,辛
苦几个月把某指标提升几个百分点——还是运气好了,运气不好直接deprecate掉。
G**U
发帖数: 180
28
呵呵,这个就是围城啊……
backend就不是一个平台火三年了吗?
如果做工程,基本就是endless debugging,大公司内部功能类似的系统往往好几个,
相互之间pk,万一被deprecate掉几年辛苦也费了一大半,最多能有点经验积累。
如果做算法,不过就是找feature,run各种分类聚类预测实验,nb一点的会在svm之类
的现成包里面调调参数,绝大多数还是每天做各种数据萃取清洗转格式外加debug,辛
苦几个月把某指标提升几个百分点——还是运气好了,运气不好直接deprecate掉。
d********w
发帖数: 363
29
来自主题: JobHunting版 - 在LinkedIn做面试官的故事
http://zhuanlan.zhihu.com/donglaoshi/19949853
笔者之前在LinkedIn做技术工作同时,也花了不少时间在招聘上,成为了当时LinkedIn
前三的面试官,包括挖掘候选人,参与校园招聘,草拟面试题,电话面试,Onsite面试
,填写反馈,和最后决定是否发放Offer,都有完整的流程和经历,我就按问答形式给
大家借鉴。这里也推荐一下我的新书:程序员面试白皮书(An Ultimate Guide to
Coding Interviews),有任何建议意见,请不吝赐教:)
问题:硅谷公司的招人的渠道有哪些,跟国内有何不同?
一般公司都有自己的Refer和面试系统,HR人员寻找候选人,在LinkedIn上就有丰富全
面的简历库,通过对毕业学校,就职公司的过滤去挖掘潜在员工。还有一些高水平的学
术会议,工业界愿意支持和参与,像SIGMOD,VLDB顶级数据库大会;也喜欢举办公开技
术讲座,邀请社会各界参加,注册时留下联系方式。或者写一些技术博客,开源产品,
通过他们做的有意思的项目来间接吸引人才。有时也举办一些hackathon比赛,24小时
做出一个... 阅读全帖
X******2
发帖数: 5859
30
来自主题: JobHunting版 - 这个老印公司很能烧
感觉是忽悠。
就是靠了斯坦福那块牌子,和gunnar carlsson的名气。
跟什么流型上的机器学习一个路子,概念上有点意思但是对解决
实际问题鸟用没有。搞到几年到现在还只是停留在一个谱聚类在
癌症分辨上一个简单应用。
不过也不用担心,这公司到一定时候肯定能卖掉,因为有几家很
有名的投资公司给它下了注。

发帖数: 1
31
楼主申请了Quantitative Analyst Intern, Summer 2016,求host match收留~~
楼主本科T大的,目前在美东计算机博士二年级在读,研究方向是machine learning和
data mining,主要就是在一个我们的数据上做分类、聚类算法。最近也在做deep
learning的算法
编程方面的话c++ python R Matlab都经常用,Java和Scala最近在搞map/reduce,也开
始用了
其他还有一些杂七杂八不深入的。。比如本科大作业搞过网络编程传传文件消息神马的
,上次实习的时候做网站用Ruby和JS搞过前端后端
求各种组收留,楼主自学也还算快,多谢~
z*********n
发帖数: 1451
32
来自主题: JobHunting版 - 请教一道FB的面试题
用一些聚类算法可以吧,距离就用interaction 程度。
w****k
发帖数: 755
33
模式识别,聚类分析,当然结果会有一定误差。
R*********r
发帖数: 225
34
来自主题: JobHunting版 - 国内初创公司招数据科学家
有兴趣的请和我邮件联系:amstat2006 at gmail dot com
初创公司,创始人是美国海归,公司文化是美国公司的文化,不搞996. 目前还处于隐
身状态,获得了国内一线顶级VC的天使轮,现在招1到2个数据科学家
要求:有1-3年工作经验 硕士及以上 全职
工作地点:北京
职位诱惑 : 非常有竞争力的薪酬,早期员工期权
职位描述
工作职责
收集用户需求确定适合的数据模型,并协助软件开发工程师完成部署实现
参与设计和部署先进的大数据分析/机器学习/人工智能模型服务
任职要求
扎实的统计和机器学习的背景(假设检验,回归,分类,推荐,聚类)
熟练掌握SQL和至少一种脚本语言(Python、R等)
能够设计和开发其他API接口经验者优先考虑
学历:计算机,数学,物理等相关领域的研究生及以上
工作经验:在定量分析,数据科学或软件工程等领域有2年及以上从业经验
薪资福利
非常有竞争力的薪酬,早期员工期权
学术/科技会议赞助
免费餐食饮料,交通补助,餐补,通讯补贴,团队旅游
带薪年假,五险一金
x*****g
发帖数: 353
35
我们是一家致力于采用新一代人工智能科技改变传统人类生活的互联网创业企业。我们
致力于成为世界顶尖的专业垂直领域自然语言处理,人工智能的解决方案和系统提供方
。核心团队成员来自MIT,剑桥,清华,北大,中科院,北航,浙大等,有丰富的一线
互联网和创业公司经验,已获得顶级风险投资基金的投资。
公司研发团队占总人数80%以上,在北京/硅谷设立相应研发机构。公司团队崇尚工程师
文化,既有人工智能&数据方向领军人物,也有充满潜力的技术极客,在这里你能够与
行业尖端领袖一起学习交流。我们专注于前沿技术的研究,机器学习、图像识别、语音
识别、NLP、大数据挖掘等,并参加国际相关领域的比赛,技术氛围浓厚。这里一定有
你喜欢的研究方向。我们期待你的到来!

【为什么选择汉宇 Next Talk】
人工智能/大数据正在风口的行业(起点选择很重要,选offer的第一步是根据趋势选择
行业)
一个好的职业生涯起点(如果你做得好,不分你的学历,背景,都将会有晋升机会,公
司会把好的资源给到做得好的人)
一个靠谱的强大团队(团队内的核心成员大多来自于名牌公司或名牌大学,都属于很聪
明,效率极高的人,公司氛围开放... 阅读全帖
g*****l
发帖数: 424
36
来自主题: JobHunting版 - 数据科学之江湖兵器谱 (转载)
【 以下文字转载自 DataSciences 讨论区 】
发信人: greatel (灵致), 信区: DataSciences
标 题: 数据科学之江湖兵器谱
发信站: BBS 未名空间站 (Sun Oct 9 16:57:10 2016, 美东)
【注】原发于微信公众号:data_wisdom
数据江湖,风起云涌。各路英豪,群雄逐鹿。
这是一个数据科学最好的时代,也是数据江湖最乱的时代。
那么在这么一个特殊的江湖里面浪,有什么兵器是值得我们去关注的呢?这篇文章列举
了一些常用方法(刀剑),并不涵盖工具与平台。就先让我们一起去看看这个排名不分
先后左右的兵器谱。
数据科学家Vincent Granville博士发表博文列举了数据科学家常用的45种技术。这是
个很适合初学者去逐个了解的列表。当然,这并不代表数据科学(统计学)的全部。虽
然他并没有提出自己的详细总结,但是有志于学习数据科学的同学不妨初步有个印象,
有不太熟悉的topic可以进一步去了解一下。另外我在后面也补充了我认为也值得学习
的领域,很多人都会在日常的数据实践中用到。多学有益于身心健康。
首先需要说明的是,这些技术... 阅读全帖
l****r
发帖数: 119
37
来自主题: JobHunting版 - 离成功转码还有多远? (转载)
【 以下文字转载自 Programming 讨论区 】
发信人: lshtar (Ishtar), 信区: Programming
标 题: 离成功转码还有多远?
发信站: BBS 未名空间站 (Thu Oct 26 19:14:48 2017, 美东)
我是EE转码的,去年毕业,公司码农的工作没找到,在一个医院做了半年(号称研究机
器学习)的博后(工资低),说说感受:
能接触真实的医疗数据,数据库里有病人就诊记录包括吃的药和化验指标,但是数据比
较乱也很深奥,没有医疗行业知识,不懂药名和化验指标是什么意思,现学的话总觉得
差好远。所以,老板说让做什么就做什么。主要用python,pandas,sklearn,某些问
题用R做。研究的问题感觉都比较trivial。感觉都不是真正的机器学习,是简单的算数
分析。问题的定义也不是特别清楚。
还做了几个NLP的小project,论文的聚类,涉及到:
web scraping, 把论文从网上扒下来,用python beautiful soup, asyncio
feature 提取:用一个Medical Text Indexer (MTI)的... 阅读全帖
k********6
发帖数: 6
38
单位介绍
广州中国科学院软件应用技术研究所(中国科学院软件研究所广州分部,简称
广州软件所),成立于2011年05月27日,是由广州市人民政府与中国科学院共建的具有
独立法人资格、行政上隶属于广州市人民政府的直属事业法人单位,是广州市政府创新
发展模式的试点单位之一。
广州软件所同时也是中科院软件所广州分部,充分依托中科院软件所强大的科
研能力,以市场为导向,结合广州地区的区位政策优势、人才资源优势及 市场优势,
与当地政、产、学、研广泛合作,深入开展智慧城市和云计算产品的研发、生产和销售
工作,促进广州地区软件产业的快速发展。
预期在2014年,广州软件所人员规模达到550人,通过国家、中科院和广东省的
各类人才计划,聘任10名以上学科、领域带头人,引进40名 以上科研骨干,形成科技
成果50项;申请国家工程中心或实验室,孵化2家以上软件企业,形成产业集群,年销
售收入超过4000万元,带动企业新增销售收入 超过4亿元。
岗位1:数据挖掘分析助理研究员/研究实习员
岗位职责:
1、研究、分析业务数据,给业务部门提供优化建议;
2、研究大数据... 阅读全帖
c*********7
发帖数: 19373
39
来自主题: Living版 - 什么盒子可以看视频网站?
需要能破解的盒子安装聚类软件才能看各个视频源。我用的新小米盒子+兔兔视频/泰杰
视频可以。不过这东西需要从国内运过来。
c********i
发帖数: 638
40
来自主题: Parenting版 - 有没有孩子体育玩三大球的?
我念书的时候对这些东西不感兴趣,老板给啥数据就分析啥数据。拿到全国性的样本组
里就进行了初步描述分析,印象特别深的就是当时几个人做聚类分析的时候TEAM
SPORTS 总是跟SUBSTANCE USE纠结在一起。美国的观察数据尤其是有足够样本量进行细
化分析的不是想象的那么多,很多文章因为样本小经费不够要么只集中谈一个TEAM
SPORTS,要么把所有的TEAM SPORTS 算到一起一勺烩。这个链接大致还行吧。
ncbi.nlm.nih.gov/pubmed/25290659
今年上半年同一个研究所的博后给俺的科普,希望大家还是有个红灯亮在这:
可卡因的瘾是永远解除不掉的。
可卡因的治疗的实质是用一种副作用小的药物(合法,便宜)来替代可卡因,这样能让
一个人还有清醒的时候,做出正常人的行为,而且药物容易得到(处方药)也便宜,能
有效防止犯罪。一旦停药,瘾就会复发。其它毒品的使用是可卡因的前奏,通往极乐世
界的第一步。使用这种替代药物的人还是跟常人不一样,基本上是废掉的。
R*********r
发帖数: 225
41
【 以下文字转载自 JobHunting 讨论区 】
发信人: RProgrammer (RP), 信区: JobHunting
标 题: 国内初创公司招数据科学家
发信站: BBS 未名空间站 (Sun Aug 28 22:28:33 2016, 美东)
有兴趣的请和我邮件联系:amstat2006 at gmail dot com
初创公司,创始人是美国海归,公司文化是美国公司的文化,不搞996. 目前还处于隐
身状态,获得了国内一线顶级VC的天使轮,现在招1到2个数据科学家
要求:有1-3年工作经验 硕士及以上 全职
工作地点:北京
职位诱惑 : 非常有竞争力的薪酬,早期员工期权
职位描述
工作职责
收集用户需求确定适合的数据模型,并协助软件开发工程师完成部署实现
参与设计和部署先进的大数据分析/机器学习/人工智能模型服务
任职要求
扎实的统计和机器学习的背景(假设检验,回归,分类,推荐,聚类)
熟练掌握SQL和至少一种脚本语言(Python、R等)
能够设计和开发其他API接口经验者优先考虑
学历:计算机,数学,物理等相关领域的研究生及以上
工作经验:在定量分析,数据科学或软... 阅读全帖

发帖数: 1
42
来自主题: Stock版 - 你们谁知道Gene Ontology 分析?
其实就是聚类分析,根据每个个体的特征把所有样品归类。gene是根据其结构特征归类
其可能的功能或代谢通路。股票是?
w*****m
发帖数: 20421
43
我支持LZ,机器人1940年代就开始搞了,转眼70多年过去了
能正经走路不摔跤的机器人都很少,商业使用更是无从谈起,
所谓的机器人更像一个机器,翻来覆去地重复几个动作而已。
其实最简单的叠衣服,对机器人就是个一百年研究的课题。大学的
人工智能和MACHINE LEARNING的课程2000年的时候就有了,
20年过去了还是那些课程,还是那些东西,神经网络,模糊聚类,
其实没有什么质的突破,很多招摇撞骗的骗子,国内最近流行
区块链,到处都跟着区块链搞诈骗,中国人连最起码的诚信都没有,
CREDIT都搞不起来,还什么区块链,全民搞诈骗?AI和大数据的泡沫确实
很大,针对大数据,我提出炸数据,故意给收集个人数据的GOOGLE FB AMZN
提够假数据,如果能带上病毒就更好,直接炸掉他们的大数据,或者
产生虚假的PATTERN,让他们赔掉腚。
l****a
发帖数: 466
44
来自主题: Boston版 - 昨天去聚福轩很失望
他家好像海鲜类做得还不错
D****R
发帖数: 6053
45
来自主题: Connecticut版 - 版聚在果园……
PATPAT! 难道你住当年工业重镇BRIDGEPORT?钓鱼也就是一种HOBBY,能拿几条回家吃
也不错,在这里买鱼是即便宜又省事。
新鲜的螃蟹吃起来带甜味的,就像新鲜的帝王蟹腿和鱿鱼一样。。。
NE的海鲜还是很有名的,NORWALK Norm Bloom and Son 的贝壳类,Stonington 的各类
海鱼。。。
r*******d
发帖数: 1083
46
来自主题: LosAngeles版 - 老牛看版聚
哈哈,赞,老牛真牛!
补充,变态看起来一点都不变态,看起来挺老实的亚,样子长得有点象韩国帅锅
还有,看到了 USC DV中若干美女,假借和美女们搭讪之机偷窥了无数眼,羡慕吧,哈哈
littledeer 大美女的一对爱兔也是巨可爱,后来杀人的时候无数好人坏人企图以“看兔
子”的名义立证自己的清白
最意外的是,居然看到了前一段在版上挖了大坑无数在LA版掀起了前所未有的灌水狂潮一
战成名天下知的Wecheer. 我一听是这么有名的ID激动死了,要不是服务员上菜了我就非
大雪山哭求签名去了。
对了,有幸和前USC主席同桌吃饭真是不胜荣幸亚,前主席一点架子都没有非常平易近人
,而且妙语连珠,逗得俺花枝丸乱颤,而且主席与Larky的俊男美女档也是非常养眼。
我们的小讷也是光彩照人,以具有民族特色的唐装出场,再搭配招牌甜美笑容,不时的还
冒出惊人之语......










H








分成了两拨。楼上的十人左右开始聆听3P大法李大师的布道。李大师被willlu尊为profes










q******n
发帖数: 5262
47
我准备上 点天灯,人头风筝这类的酷刑谴责。
K****n
发帖数: 2485
48
来自主题: LosAngeles版 - 中秋版聚更新消息
又没强制规定公布个人收入、职位、有没有房子车子票子,你急啥?
每次你遇到版上其他ID,互相打招呼的时候总会互相问问对方什么ID、来自国内哪里,
现在住在哪个city这类很一般的问题,无非为了找找大家的共同点,好产生话题。15秒
钟就能搞定的事,别想得太复杂,呵呵
r*****e
发帖数: 4598
49
嗯嗯 一定努力
BTW 印象里湖南gg都挺善良好相处 文质彬彬的 绝非匪类
c********e
发帖数: 147
50
来自主题: Minnesota版 - 周六版聚的同学请注意
有没有烧烤器具,可以带些烧烤类现场做不?
首页 上页 1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)