由买买提看人间百态

topics

全部话题 - 话题: 信息检索
首页 上页 1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)

发帖数: 1
1
来自主题: Military版 - 大家千万不要瞧不起图书管理员
cs教授不配吧
Fb码工死了都没啥表示


: 太祖时代的图书馆管理员就是信息检索领域的绝对权威,北大图书管理员,其实
应该对

: 标现在top 2 cs教授

A*****a
发帖数: 52743
2
来自主题: Automobile版 - 高速路上车祸历史检索
你确信这是公开的信息?
k********6
发帖数: 6
3
单位介绍
广州中国科学院软件应用技术研究所(中国科学院软件研究所广州分部,简称
广州软件所),成立于2011年05月27日,是由广州市人民政府与中国科学院共建的具有
独立法人资格、行政上隶属于广州市人民政府的直属事业法人单位,是广州市政府创新
发展模式的试点单位之一。
广州软件所同时也是中科院软件所广州分部,充分依托中科院软件所强大的科
研能力,以市场为导向,结合广州地区的区位政策优势、人才资源优势及 市场优势,
与当地政、产、学、研广泛合作,深入开展智慧城市和云计算产品的研发、生产和销售
工作,促进广州地区软件产业的快速发展。
预期在2014年,广州软件所人员规模达到550人,通过国家、中科院和广东省的
各类人才计划,聘任10名以上学科、领域带头人,引进40名 以上科研骨干,形成科技
成果50项;申请国家工程中心或实验室,孵化2家以上软件企业,形成产业集群,年销
售收入超过4000万元,带动企业新增销售收入 超过4亿元。
岗位1:数据挖掘分析助理研究员/研究实习员
岗位职责:
1、研究、分析业务数据,给业务部门提供优化建议;
2、研究大数据... 阅读全帖
g******6
发帖数: 942
4
Google来的:
阿里招揽多位计算机科学家 组建创新团队IDST
2014年11月03日09:53 新浪科技 微博 我有话说(107人参与) 收藏本文
新浪科技讯 11月3日上午消息,近段时间以来多位全球高级科学家陆续加盟阿里巴
巴集团,这些科学家将在美国西雅图、硅谷、北京、杭州等地组建专门的科学团队,分
布式推进阿里巴巴集团的前瞻性研究与应用。这些研究已经进行数月,被归属到阿里巴
巴集团旗下一个创新机构,该机构在内部被叫做IDST(Institute of Data Science&
Technologies)。
自2014年以来,来自美国多所高校的科学家陆续加入阿里巴巴集团,包括了机器学
习、大数据挖掘、自然语言处理、移动搜索、多媒体识别等领域。此后,IDST逐步组建
成型。
据悉,IDST被要求通过前瞻性研究来确立阿里巴巴集团在未来数十年的领先地位。
该机构内博士以上学历占70%以上,分别在太平洋两岸四地成立研究团队。
团队负责人之一漆远来自普渡大学计算机系和统计系两个系的终身教授,擅长机器
学习和人工智能,为全球机器学习顶级会议ICML 2014 和 ... 阅读全帖
g******6
发帖数: 942
5
Google来的:
阿里招揽多位计算机科学家 组建创新团队IDST
2014年11月03日09:53 新浪科技 微博 我有话说(107人参与) 收藏本文
新浪科技讯 11月3日上午消息,近段时间以来多位全球高级科学家陆续加盟阿里巴
巴集团,这些科学家将在美国西雅图、硅谷、北京、杭州等地组建专门的科学团队,分
布式推进阿里巴巴集团的前瞻性研究与应用。这些研究已经进行数月,被归属到阿里巴
巴集团旗下一个创新机构,该机构在内部被叫做IDST(Institute of Data Science&
Technologies)。
自2014年以来,来自美国多所高校的科学家陆续加入阿里巴巴集团,包括了机器学
习、大数据挖掘、自然语言处理、移动搜索、多媒体识别等领域。此后,IDST逐步组建
成型。
据悉,IDST被要求通过前瞻性研究来确立阿里巴巴集团在未来数十年的领先地位。
该机构内博士以上学历占70%以上,分别在太平洋两岸四地成立研究团队。
团队负责人之一漆远来自普渡大学计算机系和统计系两个系的终身教授,擅长机器
学习和人工智能,为全球机器学习顶级会议ICML 2014 和 ... 阅读全帖
n******n
发帖数: 567
6
来自主题: JobHunting版 - 两个设计题
1, 怎么根据tweet做clustering??
2, 给一组tweet的inverted index,怎么找一个phrase(多个词)的最短组合,比如找
phrase "twitter good tool", twitter is a good tool就比twitter is good,
facebook is a better tool距离近??
有没有相关的书之类的,这应该是信息检索??
s******s
发帖数: 84
7
来自主题: JobHunting版 - 内推一家Palo Alto的startup公司
之前帮着大家推了一些职位,因为公司比较小以前发的简历还有一些没有推。
我会持续帮着内推的。
现在我们公司data science组迫切需要自然语言处理,信息检索以及机器学习有经验的
人,如果大家谁有相关的经验或者对我们公司感兴趣,麻烦请把简历发给我。data
scientist希望是PhD candidate 或者有NLP工作经验的Master.
如果大家对于其他职位有兴趣的,也请继续发邮件到我邮箱 (innerpeacecnr@gmail.
com)。
职位链接:https://www.linkedin.com/vsearch/j?page_num=1&locationType=Y&f_C=
3076102&trk=careers_promo_module_see_jobs
k********6
发帖数: 6
8
单位介绍
广州中国科学院软件应用技术研究所(中国科学院软件研究所广州分部,简称
广州软件所),成立于2011年05月27日,是由广州市人民政府与中国科学院共建的具有
独立法人资格、行政上隶属于广州市人民政府的直属事业法人单位,是广州市政府创新
发展模式的试点单位之一。
广州软件所同时也是中科院软件所广州分部,充分依托中科院软件所强大的科
研能力,以市场为导向,结合广州地区的区位政策优势、人才资源优势及 市场优势,
与当地政、产、学、研广泛合作,深入开展智慧城市和云计算产品的研发、生产和销售
工作,促进广州地区软件产业的快速发展。
预期在2014年,广州软件所人员规模达到550人,通过国家、中科院和广东省的
各类人才计划,聘任10名以上学科、领域带头人,引进40名 以上科研骨干,形成科技
成果50项;申请国家工程中心或实验室,孵化2家以上软件企业,形成产业集群,年销
售收入超过4000万元,带动企业新增销售收入 超过4亿元。
岗位1:数据挖掘分析助理研究员/研究实习员
岗位职责:
1、研究、分析业务数据,给业务部门提供优化建议;
2、研究大数据... 阅读全帖
p*****d
发帖数: 1
9
阿里的搜索系统承载着全世界收录最多、访问最大、交易最高的商品搜索引擎(s.
taobao.com),也提供全中国最权威的比较购物搜索服务(etao.com)。我们的系统服务
于阿里集团所有的核心业务领域,从淘宝到天猫到B2B到一淘网到无线,搜索直接和间
接引导的成交占到了全站总成交额接近一半的份额,搜索产品也是淘宝广告业务最大的
载体。外网和内网商品的变化会在100秒的时间内在引擎上得到更新,我们致力于把这
个时间缩短到秒级,致力于在全系统平台化,致力于进一步提升商品搜索体验,最终大
幅提升搜索引导成交的份额。
搜索算法研究员 - 北京/杭州
工作职责:
- 负责淘宝搜索产品体系里创新的关系搜索产品的研发工作
- 全面负责一淘网搜索所需抽取、聚合、排序等算法工作
- 负责查询分析、文本发掘等自然语言处理方面的基础建设
- 负责淘宝知识图谱建设,在用户/商品间发掘高质量关系和特色标签
- 负责机器学习算法平台的研究、优化,以及在阿里集团推广
职位要求:
- 机器学习,信息检索,大规模数据挖掘,推荐等相关方向博士
- 在搜索或广告相关性算法,海量数据分析,用户行为理解与挖掘,推荐等相关领域... 阅读全帖
d******n
发帖数: 186
10
【 以下文字转载自 WashingtonDC 讨论区 】
发信人: dawnrain (fishman), 信区: WashingtonDC
标 题: Comcast在DC附近招2个full time senior researcher 和4-5个summer intern
发信站: BBS 未名空间站 (Mon Nov 17 10:15:33 2014, 美东)
替公司在这里贴个广告,如果你有下面列举的经验,可以考虑一下:
需要的经验/技能:
机器学习、推荐系统、计算机视觉、社交媒体、信息检索、自然语言处理
工作地点在Washington DC,具体的广告如下:
============================================================================
=====
Fulltime Job ad:
Are you interested in solving problems that involve massive data sets and
improve the experience of millions of ... 阅读全帖
j*****5
发帖数: 9
11
阿里巴巴数据挖掘团队招聘(LBS、NLP、知识图谱方向)
业务平台事业部,是搭建阿里电商大中台的产品技术基石,坐拥交易、商品、会员、店
铺、推荐、营销、数据等多个核心业务平台,在阿里电商体系形成真正的大闭环进程中
承担着不可或缺的核心地位,力争搭建起一个世界级的电商SAAS平台,为集团各电商体
系提供更为可靠、高效、易扩展的平台服务……
随着电商向新零售的升级,业务平台事业部数据团队承担了人货场数据升级与重构的职
责。消费者(人)线下行为挖掘使得线下商业行为能够与线上一样数字化,商品(货)
标准化使得全世界的商品能够自由在阿里各个平台间无缝流动,并且 与线下商户(场
)产生关联。在数据管理及服务方面,从传统数据库升级至知识图谱,使数据成为能够
产生智能应用的知识!
在这里,你有机会与业界顶尖专家一起专研最新技术:包括知识图谱、NLP、时空数据
挖掘,视频行为识别。也有机会将技术应用在最前沿及最广泛的业务领域:无线个性化
、盒马鲜生、智能问答、假货治理。
我们是一个算法专家团队,25%博士,90%硕士及以上,25%有海外留学经历。团队成立5
年,一直在同一个领域深耕发展。如果你是海外优秀... 阅读全帖
j*****5
发帖数: 9
12
阿里巴巴数据挖掘团队招聘(LBS、NLP、知识图谱方向)
业务平台事业部,是搭建阿里电商大中台的产品技术基石,坐拥交易、商品、会员、店
铺、推荐、营销、数据等多个核心业务平台,在阿里电商体系形成真正的大闭环进程中
承担着不可或缺的核心地位,力争搭建起一个世界级的电商SAAS平台,为集团各电商体
系提供更为可靠、高效、易扩展的平台服务……
随着电商向新零售的升级,业务平台事业部数据团队承担了人货场数据升级与重构的职
责。消费者(人)线下行为挖掘使得线下商业行为能够与线上一样数字化,商品(货)
标准化使得全世界的商品能够自由在阿里各个平台间无缝流动,并且 与线下商户(场
)产生关联。在数据管理及服务方面,从传统数据库升级至知识图谱,使数据成为能够
产生智能应用的知识!
在这里,你有机会与业界顶尖专家一起专研最新技术:包括知识图谱、NLP、时空数据
挖掘,视频行为识别。也有机会将技术应用在最前沿及最广泛的业务领域:无线个性化
、盒马鲜生、智能问答、假货治理。
我们是一个算法专家团队,25%博士,90%硕士及以上,25%有海外留学经历。团队成立5
年,一直在同一个领域深耕发展。如果你是海外优秀... 阅读全帖
b*********e
发帖数: 72
13
来自主题: Returnee版 - 千青答辩简介
无恶意转载(from 千人论坛)。。。呵呵
【zz】LZ心是好的,但觉得有这个千人论坛已经够了,有时我们太过习惯于所谓各种“
经”带来的便利,考GT有机经,面试有面经,现在又专门冒出来海龟经……久而久之丧
失信息检索能力——基本独立生存能力,同时加固从众依赖心理,以至于30多岁人了,
出来面个试,还想着要同行搭伙;15分钟的陈述答辩还思量着索要模板,难道跟着大家
都一个模子刻出来就觉着很安全?个人而言对此不感冒,并感到可笑!
l******0
发帖数: 244
14
来自主题: StartUp版 - 问个特种搜索引擎的问题
搜索引擎本身,可以说真的没太多搞的空间。尤其是当 lucene 提供了大多数的基本搜
索功能和应用后。当然,跟信息检索相关的技术,如果扩展下去,比如有位同学提到的
,如何知道 green card, 绿卡是同一样东西,可搞的东西就很多,但那已经超出了搜
索引擎的范畴。
其实,如何从网络上获得并组织好数据,也是个很大的挑战。比如,上面提到的,如果
你要扩展到网络上的所有论坛,如何去爬这些论坛,就不是一件容易的事。如果做一个
股票的网站,如何把网络上所出现的,与这个股票及其公司相关的新闻,消息全部抓取
过来,也不是一件容易的事。
d*****g
发帖数: 978
15
来自主题: Stock版 - WUBA 要爆了
我是不是信息检索方式不对, 怎么没看到啊?
m******e
发帖数: 3
16
来自主题: I140版 - 请教移民美国的途径
上个月去美国出差一个多月 感觉挺好的 就动了念头。
不知道我这种条件的有什么途径有可能有移民美国的机会呢:国内的硕士,工作经
验7年多(头5年软件 信息检索相关工作经验 后2年多外企医疗器械算法工作经验)
不想依靠什么婚姻一类移民哈 而且目前这个年纪也不是很想留学(30出头) 请
高人指点 多谢!
c********a
发帖数: 125
17
借宝地问一下,知网怎么看到citation的细节阿?我只找到了被引用的次数,但是找不
到具体title,auther,journal等相关的信息.
谢谢
p********r
发帖数: 3243
18
还有一个方法也许可以尝试一下:
中文CNKI--->中国学术期刊网络出版总库
(而不是选“中国学术文献网络出版总库”)
-->检索自己的文献-->点击引用次数
-->打印引用列表页面。
这个打印页面也许更友好更易操作一些。
谢谢。
e****e
发帖数: 158
19
来自主题: Immigration版 - 审稿机会:语音加密方向。
这篇论文还需要人审稿。有意者请站内信箱联系。多谢。有加密或者信息检索相关
knowledge即可。
e*******n
发帖数: 872
20
关键词:Steganalysis, Similarity retrieval, Image content, Unsupervised
outlier detection
有兴趣的同学请站内邮箱联系我,把你的姓名,公司,职位,email,发给我。
谢谢!
t*******s
发帖数: 3031
21
来自主题: Minnesota版 - 再简单不过的酒酿
我老上本科四年级信息检索课,任课老师说,同学们,你们里面有掌握了google的,我
这课可以不来。你猜我咋地?
t*******s
发帖数: 3031
22
来自主题: Minnesota版 - 再简单不过的酒酿
我老上本科四年级信息检索课,任课老师说,同学们,你们里面有掌握了google的,我
这课可以不来。你猜我咋地?
k*****e
发帖数: 22013
23
你作为一个理工男,
请问你是不会信息检索?
还是手残不会点链接?
还是不会英文阅读?
还是眼瞎根本看不见?
还是弱智不会四舍五入?
到底是哪一项不会?
“As of May 2012, the average hourly wage – including tips – for a
restaurant employee in the United States that received tip income was $11.82
.[5]”
d******n
发帖数: 186
24
替公司在这里贴个广告,如果你有下面列举的经验,可以考虑一下:
需要的经验/技能:
机器学习、推荐系统、计算机视觉、社交媒体、信息检索、自然语言处理
工作地点在Washington DC,具体的广告如下:
============================================================================
=====
Fulltime Job ad:
Are you interested in solving problems that involve massive data sets and
improve the experience of millions of people? Do you have experience in at
least one or more of the following areas – Large-scale Machine Learning,
Recommendation Systems, Social Media, Computer Vision, Information Retrieval... 阅读全帖
c**c
发帖数: 2593
25
来自主题: LeisureTime版 - 我知道你眼中并没有我
呵呵,这些都是日常容易混用的概念。信息检索领域里头还有precision和recall两种
指标,precision大致是说你找到的那一堆结果里有多大百分比是正确的,recall大致
是说正确答案里有多大百分比被你找到了。平常人说的accuracy,在这里就显得比较泛
,不知所指。
d********f
发帖数: 43471
26
来自主题: Joke版 - 生物转计算 指南 (转载)
【 以下文字转载自 Biology 讨论区 】
发信人: sunflowerboy (lonestar), 信区: Biology
标 题: 生物转计算 指南
发信站: BBS 未名空间站 (Sun Sep 23 17:05:04 2012, 美东)
看到总有人问, 总结几句, 语言轻松, 内容充实, with bias, 不计版权, 欢迎
补充:
各位可以从以下课程筑基:
研究生课程: 概率论, 统计, experimental design, 机器学习
本科生课程: C++, 数据结构, 算法
想进一步的话, 可从以下炼体:
研究生课程: 线代, 数分,优化, 数值
本科生课程: 操作系统, 网络, 数据库, AI
炼气:
研究生课程: 多元分析, 实分, 随机过程
本科生课程: 体系结构, compiler, 心事语言, 图新图像
结丹:
研究生课程: 微风几何, 微风方程, 拓扑
研究生课程:text mining, 信息检索, 视觉
化升:
研究生课程: 复分, 泛函
研究生课程: ???
化升以上, 如果没有迷失在空间乱流, 以致灵界, 修炼由是不同
各位wet sci... 阅读全帖
t*******3
发帖数: 2005
27
来自主题: Joke版 - 生物转计算 指南 (转载)
炼气:
研究生课程: 多元分析, 实分, 随机过程
本科生课程: 体系结构, compiler, 心事语言, 图新图像
==========================================
形式语言,图形图像
结丹:
研究生课程: 微风几何, 微风方程, 拓扑
研究生课程:text mining, 信息检索, 视觉
========================
微分几何,微分方程
====================================================
学这些有个屁用,做计算来说说
c***r
发帖数: 3965
28
来自主题: Piebridge版 - 征友 女ID 信息列表
为啥不搞个spreadsheet便于检索和比较
g***e
发帖数: 1168
29
我不仅文盲,而且定力差,,,汗,没忍住来回帖了,,,@___@,,,见笑了。
凭我中学时代的印象胡和实证主义关系密切;他同侪当中有一个我很讨厌,但是最近令
我很仰慕国文修养的人:鲁迅。同时看的书一堆,拆东补西,导致,我也没有认真看,
没有印象周的观点是否有可喜奇脱处。出于乡巴佬的心情,单纯被文字功夫惊讶了。
关于“诗”你下文所述,也是直接导致我按奈不住上來雷人的:这个描述,恐怕太简单
--简单到粗暴而既不能在抽象的层次脱离积累而在在认识上有所突破(所谓拾人唾余
,而且依我一孔愚见,恐怕還是那些无趣的鱼目),也没有多少审美上的余裕。总之,
我简直看不到一点值得写(或者说重抄上來)的地方:今日信息检索这样方便,知识性
积累实在无益,尤其bbs上;更需洞见;何况在我看来,你重复的这些称不上“知识”
。日久积渍的庸见吧。
文學发展如此复杂,在中国尤其如此;哪有这么简单清晰的几句话好讲的清楚的?我们
工程学科,最近三四十年积累下的人造系统(所谓Internet),尚不能找到简单的模型
描慕其发展,何况积中华精粹,前贤前赴后继,灿烂壮阔的三千年诗之发展?我虽然憎
恨自己无知,但在学习中一些孤陋想法... 阅读全帖
d*****s
发帖数: 1407
30
来自主题: paladin版 - 生物转计算 指南 (转载)
【 以下文字转载自 Joke 讨论区 】
发信人: daemonself (mit行为艺术专业博士后导师), 信区: Joke
标 题: 生物转计算 指南 (转载)
发信站: BBS 未名空间站 (Mon Sep 24 21:56:19 2012, 美东)
发信人: sunflowerboy (lonestar), 信区: Biology
标 题: 生物转计算 指南
发信站: BBS 未名空间站 (Sun Sep 23 17:05:04 2012, 美东)
看到总有人问, 总结几句, 语言轻松, 内容充实, with bias, 不计版权, 欢迎
补充:
各位可以从以下课程筑基:
研究生课程: 概率论, 统计, experimental design, 机器学习
本科生课程: C++, 数据结构, 算法
想进一步的话, 可从以下炼体:
研究生课程: 线代, 数分,优化, 数值
本科生课程: 操作系统, 网络, 数据库, AI
炼气:
研究生课程: 多元分析, 实分, 随机过程
本科生课程: 体系结构, compiler, 心事语言, 图新图像
结丹:
研究生课程: 微风几何, 微... 阅读全帖
f******t
发帖数: 2664
31
尹曼教授的夫人,JHU计算机系图书馆主任M是一个让人梦寐以求的女人,
看上去和尹曼教授很般配。朱丽亚在心里评价。红褐色的头发剪成男孩子的模样,修长的身体上随便地套了一件剪裁得体的砖红色衬衫,露出雪白的脖子和胳膊。客厅里按照现代风格收拾的简洁而色彩明亮,两个小孩坐在和客厅连在一起的饭厅里看书,男孩子大卫,据说是小哥哥,长着红色头发。女孩子埃米利是金色头发,漂亮的像一个洋娃娃。
或许是学计算机信息检索的缘故,尹曼太太对两个星期前发生的事情记忆清楚。
“那天下午尹曼提早下班了。通常他七八点的时候到家,有的时候更晚些。但是大卫的学校巴士在D.C市中心抛锚了,学校会联系另一辆校车。但是那天刚好我送埃米利去看医生,埃米利没有上课,所以我让尹曼早点回家,我们一起去D.C接大卫,打算顺便在round rock吃埃米利最喜欢的中餐。本来打算在D.C多待一会儿,但是埃米利说不舒服,我们就改变计划,把埃米利接到以后,就直接开回巴尔的摩了。”
“那天之后,教授一直和你们在一起吗?”朱丽亚问。
“不,那天剩下的时间尹曼并不是一直和我们在一起。因为埃米利不舒服,而且下午刚去看过医生,尹曼就提出他去买药。他大概是五
M***o
发帖数: 980
32
cher你应该去搞个专业space,这样以后检索起来更方便。
M***o
发帖数: 980
33
cher你应该去搞个专业space,这样以后检索起来更方便。
j****u
发帖数: 1413
34
通知与报名请见:http://www.ustcif.org/default.php/content/3046/
8月31日(周三)晚,中国科大互联网校友沙龙将在北京进行。徐一龙(今日头条副总
编辑)、刘海锋(0011,京东云平台总架构师,系统
技术部负责人)、曹欢欢(0111,今日头条首席算法构架师)将分别大数据、个性化推
荐、新媒体与电商的精彩分享,欢迎感兴趣者出席。
今日头条是国内移动互联网领域成长最快的产品服务之一。它于2012年8月发布第一个
版本。今日头条累计激活用户数达5.3亿,日活跃用户
超过5300万。今日头条通过个性化推荐算法解读使用者的兴趣精准的阅读内容推荐,备
受用户关注;京东是中国最大的自营式电商企业,
拥有全球领先的云计算技术和完整的服务平台。
报名截止:8月30日23:00。一旦人数满,组织者保留随时提前无预警关闭报名系统之权
利。空降或现场交费均按照200元收费。
报名方式:两种方式任选其一即可。
1)微信报名:添加微信号“USTCIF”为好友,直接回复“北京:姓名+班级号+单位+邮
箱+手机”完成报名。
2)网页报名:网页下方报名表报名。通知与报名请见:... 阅读全帖
a****5
发帖数: 10854
35
来自主题: Xibei版 - 赶紧的,色大妈,色大叔们
信息检索也算第三产业
d******e
发帖数: 7844
36
有道理,所有关于信息检索的文献包含的价值远不如google的技术文档。
r********3
发帖数: 2998
37
不光是学生物,就连很多CS本科学生都无法适应。因为CS还是一个很原始的学科,从诞
生到现在也不过50年。不像其他学科那么成熟,分门别派都那么细致。现在要成为好的
CS学生,同时要基本工程师和科学家的素养。而现实当中,两者有很多矛盾的地方,普
通人很难两者兼顾。
学好CS首先要基本工程师的素质,而不是只知道推导算法,做编程题,和高深的数学理
论。除了能够玩转各种编程语言,还要懂各种开发工具,调试技巧。然后对各种开源框
架,数据库产品,甚至延伸产品(比如数据的OR映射的Hibernate)也要有一定了解。这
些东西看似都很简单,但是其熟练程度,直接决定了你个人的生产效率。在软件开发这
块,有经验的工程师可以一眼看出初学者花了几个星期都搞不定的bug。所以工程经验
是绝对不能忽视的。这绝对是专业工程师的要求。
但是,做到高阶的CS coder,又需要对算法,数学理论,计算模型有深入的见识。比如
你做搜索引擎,你要知道信息检索的各种理论。知道很多搜索引擎背后的原理和规则,
比如PageRank这些。知其然还要知其所以然,那么你看PageRank的时候还需要从Random
Walk的随机理论上去... 阅读全帖
r********3
发帖数: 2998
38
不光是学生物,就连很多CS本科学生都无法适应。因为CS还是一个很原始的学科,从诞
生到现在也不过50年。不像其他学科那么成熟,分门别派都那么细致。现在要成为好的
CS学生,同时要基本工程师和科学家的素养。而现实当中,两者有很多矛盾的地方,普
通人很难两者兼顾。
学好CS首先要基本工程师的素质,而不是只知道推导算法,做编程题,和高深的数学理
论。除了能够玩转各种编程语言,还要懂各种开发工具,调试技巧。然后对各种开源框
架,数据库产品,甚至延伸产品(比如数据的OR映射的Hibernate)也要有一定了解。这
些东西看似都很简单,但是其熟练程度,直接决定了你个人的生产效率。在软件开发这
块,有经验的工程师可以一眼看出初学者花了几个星期都搞不定的bug。所以工程经验
是绝对不能忽视的。这绝对是专业工程师的要求。
但是,做到高阶的CS coder,又需要对算法,数学理论,计算模型有深入的见识。比如
你做搜索引擎,你要知道信息检索的各种理论。知道很多搜索引擎背后的原理和规则,
比如PageRank这些。知其然还要知其所以然,那么你看PageRank的时候还需要从Random
Walk的随机理论上去... 阅读全帖
N**n
发帖数: 832
39
来自主题: CS版 - 王垠又发新博客了
paper能干嘛?能吃吗?多少钱一斤?
信息检索领域公认的大牛中一半人不超过3篇paper
N**n
发帖数: 832
40
来自主题: CS版 - 王垠又发新博客了
paper能干嘛?能吃吗?多少钱一斤?
信息检索领域公认的大牛中一半人不超过3篇paper
f*******s
发帖数: 451
41
小弟在东部念CS master。本项目鼓励硕士生做research, 所以除了一般的选课外,也
关注着研究方向。下学期有一门IR的课,如果上的好的话说不定可以跟着做做研究。
小弟本科非CS,对计算机各个方向都不太清楚。直觉上感觉IR还蛮有趣的,毕竟现在是
信息化社会了么。
请大大们讲讲IR的故事,就业,研究前景的等等。谢谢。
D***r
发帖数: 7511
42
比较好找工作,技术含量一般
就是一些基本的统计原理来回用
但有些巧妙构思在里面
r*******0
发帖数: 14
43
同问 最近正要选方向
J*******3
发帖数: 1651
44
来自主题: Hardware版 - Sandy Bridge展望
Sandy Bridge展望
泡泡网笔记本频道1月11日 2011年1月6日注定是个不平凡的日子,在这一天全球最
大的电子消费大展CES 2011在美国赌城拉斯维加斯拉开序幕,去年从头火到尾的苹果也
选择在这一天推出Mac App Store在线商店,而让这一天更加不平凡的便是Intel推出全
新的Sandy Bridge平台,必将引领2011年硬件、笔记本、台式机等领域的重大变革。
浮云还是板砖 Sandy Bridge能飞多久?
Click Here
如果说Intel推出的平台是产业的“领导者”和“定义者”,那么一定会有某些竞
争对手反驳,同时他们也正将此转化为行动,维持住一定市场份额,Sandy Bridge的诞
生虽得到热捧但也受到了一定程度的阻击,该如何面对强劲对手,该如何踏平2011年,
它还有许多路要走,未来的一年里Sandy Bridge到底能火多久?能飞多久?我们一起煮
酒论英雄。

Sandy Bridge简介
Sandy Bridge是英特尔即将在2011年的发布的新一代处理器微架构,仍然保持酷睿
i3、i5、i7三个系列分别针对入门级... 阅读全帖
d******e
发帖数: 2265
45
sequencemacther的时间复杂度是O(n^2) n=30 的话,一个操作算是常数c.
你6m个计算 26分钟,4分钟1M,一分钟250k.一秒大概5k.1ms大概5个计算,还算
make sense.python的话你提高不了多少了。
简单的,多进程,多基奇。说实话,问题再大10倍也是toy problem
真想提高,看看信息检索的教科书。考虑一下怎么用cosine来聚类
在复杂的,上矩阵分解。
m***r
发帖数: 359
46
来自主题: Programming版 - 好东西传送门周报汇总 2015-03-08
机器学习周报 2015-03-08
http://ml.memect.com/weekly/2015-03-08/
2015-03-08 星期日,完整版 24 条
机器学习中距离和相似性度量方法 @陈晓鸣在硅谷
机器学习ML简史 @数盟社区
Peter Norvig解决编程问题的机器学习 @网路冷眼
欧洲人脑计划改变其治理结构 @金连文
Hopfield Neural Networks为什么没有人提了呢? @西瓜大丸子汤
2015-03-07 星期六,完整版 31 条
52nlp上HMM相关文章索引 @52nlp
TKDE: Tweet分割和在NER上的应用 @AixinSG
音乐文件聚类和可视化 @爱可可-爱生活
Jürgen Schmidhuber在Reddit上的AMA @爱可可-爱生活
学术种子网站AcademicTorrents @阳志平1949
2015-03-06 星期五,完整版 38 条
踹不倒的谷歌大狗是怎样炼成的 @杨静Lillian
DeepDive Open Datasets @爱可可-爱生活
NICAR15上的报告,总结文本可视化 @爱可可-爱生活
张雨石的《... 阅读全帖
m***r
发帖数: 359
s**********y
发帖数: 509
48
讲几句秘笈, with bias, 不计版权, 欢迎补充:
各位可以从以下课程筑基:
研究生课程: 概率论, 统计, experimental design, 机器学习
本科生课程: C++, 数据结构, 算法
想进一步的话, 可从以下炼体:
研究生课程: 线代, 数分,优化, 数值
本科生课程: 操作系统, 网络, 数据库, AI
炼气:
研究生课程: 多元分析, 实分, 随机过程
本科生课程: 体系结构, compiler, 心事语言, 图新图像
结丹:
研究生课程: 微风几何, 微风方程, 拓扑
研究生课程:text mining, 信息检索, 视觉
化升:
研究生课程: 复分, 泛函
研究生课程: ???
化升以上, 如果没有迷失在空间乱流, 以致灵界, 修炼由是不同
各位wet scientists不必纠结,修了主机已是万人敌了。
s**********y
发帖数: 509
49
来自主题: Biology版 - 生物转计算 指南
看到总有人问, 总结几句, 语言轻松, 内容充实, with bias, 不计版权, 欢迎
补充:
各位可以从以下课程筑基:
研究生课程: 概率论, 统计, experimental design, 机器学习
本科生课程: C++, 数据结构, 算法
想进一步的话, 可从以下炼体:
研究生课程: 线代, 数分,优化, 数值
本科生课程: 操作系统, 网络, 数据库, AI
炼气:
研究生课程: 多元分析, 实分, 随机过程
本科生课程: 体系结构, compiler, 心事语言, 图新图像
结丹:
研究生课程: 微风几何, 微风方程, 拓扑
研究生课程:text mining, 信息检索, 视觉
化升:
研究生课程: 复分, 泛函
研究生课程: ???
化升以上, 如果没有迷失在空间乱流, 以致灵界, 修炼由是不同
各位wet scientists不必纠结,修了筑基已是万人敌了。
对博后:课程取舍可以结合所作方向。 不展开了。
讲了数学, 干脆再讲几句学生物的秘笈, 主要针对数理背景的同修有志于生物研究,
with bias, 不计版权, 欢迎各位补充:
各位可以从以下课程筑基:
... 阅读全帖
首页 上页 1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)