由买买提看人间百态

topics

全部话题 - 话题: 数据类型
首页 上页 1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)
r******y
发帖数: 9892
1
偶然看到一位二狗亲妈提到之前一个杂志访问,涉及二狗的演技:
cool音乐有一期,是翻的宫藤官九郎和狗的对谈,那个做得挺不错的
其中有一段是说J家的另外两个演技派,tokio的长濑和v6的冈田,宫藤长用并且欣赏的
两个演员,用本能和用脑思考的两个极端的演员,他认为nino是冈田类型的,但狗却说
自己硬要分类的话更接近于长濑类型的,而子俊是冈田类型的。
我同意子俊拍戏差不多是看剧本看到烂,然后会一直思考。但nino说他的剧本相当干净
,我有点奇怪,其他人也会这样说,之前问他剧本背了没有,狗就说没有,不过到了拍
戏却一点错都不出。
那篇对谈是做的真不错,看了很多遍,大多是关于流星之绊的,当时狗说了一些他自己
的关于流星的感受,然后宫藤就说谢谢nino,因为当时他还在为不知道结局应该怎么写
而烦恼,听了二狗的理解,就有了豁然开朗的感觉。
当我看到这篇对谈的时候,我已经把整个剧都看完了,所以很能理解他的这种说法,因
为结局里功一的态度的确和当时狗所理解的人物一样,而且做这样的处理功一这个人物
性格还是怎样都对的上号了。当时我就想,原来二狗已经成为了可以让人物带动剧情发
展这样的演员了吗~~
r******y
发帖数: 9892
2
偶然看到一位二狗亲妈提到之前一个杂志访问,涉及二狗的演技:
cool音乐有一期,是翻的宫藤官九郎和狗的对谈,那个做得挺不错的
其中有一段是说J家的另外两个演技派,tokio的长濑和v6的冈田,宫藤长用并且欣赏的
两个演员,用本能和用脑思考的两个极端的演员,他认为nino是冈田类型的,但狗却说
自己硬要分类的话更接近于长濑类型的,而子俊是冈田类型的。
我同意子俊拍戏差不多是看剧本看到烂,然后会一直思考。但nino说他的剧本相当干净
,我有点奇怪,其他人也会这样说,之前问他剧本背了没有,狗就说没有,不过到了拍
戏却一点错都不出。
那篇对谈是做的真不错,看了很多遍,大多是关于流星之绊的,当时狗说了一些他自己
的关于流星的感受,然后宫藤就说谢谢nino,因为当时他还在为不知道结局应该怎么写
而烦恼,听了二狗的理解,就有了豁然开朗的感觉。
当我看到这篇对谈的时候,我已经把整个剧都看完了,所以很能理解他的这种说法,因
为结局里功一的态度的确和当时狗所理解的人物一样,而且做这样的处理功一这个人物
性格还是怎样都对的上号了。当时我就想,原来二狗已经成为了可以让人物带动剧情发
展这样的演员了吗~~
b*****d
发帖数: 61690
3
统计局私企利润数据被指与实际不符
http://www.sina.com.cn 2011年07月28日01:10 经济参考报
国家统计局27日公布,1-6月份,我国规模以上工业企业实现利润24105亿元,同比
增长28.7%。全国规模以上私营工业企业实现利润同比增速居各类型企业之首。
数据显示,国有及国有控股企业实现利润7784亿元,同比增长20.2%;集体企业实
现利润386亿元,同比增长33.8%;股份制企业实现利润13772亿元,同比增长34.8%;外
商及港澳台商投资企业实现利润6291亿元,同比增长14.5%;私营企业实现利润6425亿
元,同比增长47.2%。
不过,这与《经济参考报》记者在广东、浙江两省调研发现的情况存在差异。记者
发现,沿海地区部分中小企业,当前的经营情况较为困难。
在调研中,广东省广新控股集团有限公司副总经理黄平向《经济参考报》记者介绍
,目前广东省有很多中小企业融资特别困难。一方面从银行贷款很难,另一方面大企业
对小企业的资金要求也更加严格了,比如说提前支付预付款等等。
浙江省统计局副局长王杰近日表示,浙江新增企业数量远远大于注销企业数量,没
有... 阅读全帖
a****r
发帖数: 12375
4
来自主题: Military版 - 知乎看到的裸条大数据
【 以下文字转载自 Joke 讨论区 】
发信人: chunjuan (👍春卷🐱更多春卷👍), 信区: Joke
标 题: 知乎看到的裸条大数据
发信站: BBS 未名空间站 (Thu Dec 1 23:59:19 2016, 美东)
作者:阿亮同学
链接:https://www.zhihu.com/question/47736379/answer/133681007
来源:知乎
著作权归作者所有,转载请联系作者获得授权。
可耻地答一下,真的辣眼睛啊
然后职业病做一波小分析,稍微统计了一下数据
1.学校按照类型分类,分布数量的多少依次为:
专科>中专高职技校>二三本>艺术院校
可以看出学历越高等,素质越高,生活水平越高的趋势在统计上的确是存在的,但985
,211也存在部分脑袋拎不清楚。其中竟然还有自称是北影之流戏剧学院的,神他妈脑
子有坑,北影的你这么来借钱?系唔系Excited? 知乎政治正确上多次老生常谈的“知
识改变命运,学历越高生活越好”又一次得到了验证。当然,也可能由于该样本群体的
特殊性,无法下因果性结论,只能说存在相关... 阅读全帖
Q**J
发帖数: 1196
5
来自主题: Boston版 - [大数据与居住形态] 讲座
上午这个帖子不知为何被删了,发信问了四个版主原因,没有得到回复。我只能当作是
被站风误删了。如果是版主删的,并且还要删,请告知一下原因,谢谢。这是免费讲座
,主要是交流信息,认识朋友,没有商业目的。
-----------------------------------------------------------------------
大数据究竟是 人类思维习惯颠覆还是统计科学的夸大其词?离开科学研究的高度,它
又能对我们的微观居住行为提供哪些富有价值的认知?
敬请关注New Design Alliance和Archidogs联合举办的讲座“大数据与居住形态”
嘉宾介绍
杨晓文博士, 麻省理工大学研究员,美吉居创始人
届时,杨晓文博士将从区域数据分析的高度,宏观分析波士顿产业类型,就业增长和波
士顿房价之间的关系;也将分析收入,族裔,就学等因素在社区选择中的比重;还会从
个案入手探讨个人居住选择的盲点并提供相应的数据启示。
时间:2:00PM - 4:00PM,(周六) 2015年11月7日
地点:Brookline Library Coolidge Corner Branch,... 阅读全帖
Q**J
发帖数: 1196
6
来自主题: Boston版 - [大数据与居住形态] 讲座
上午这个帖子不知为何被删了,发信问了四个版主原因,没有得到回复。我只能当作是
被站风误删了。如果是版主删的,并且还要删,请告知一下原因,谢谢。这是免费讲座
,主要是交流信息,认识朋友,没有商业目的。
-----------------------------------------------------------------------
大数据究竟是 人类思维习惯颠覆还是统计科学的夸大其词?离开科学研究的高度,它
又能对我们的微观居住行为提供哪些富有价值的认知?
敬请关注New Design Alliance和Archidogs联合举办的讲座“大数据与居住形态”
嘉宾介绍
杨晓文博士, 麻省理工大学研究员,美吉居创始人
届时,杨晓文博士将从区域数据分析的高度,宏观分析波士顿产业类型,就业增长和波
士顿房价之间的关系;也将分析收入,族裔,就学等因素在社区选择中的比重;还会从
个案入手探讨个人居住选择的盲点并提供相应的数据启示。
时间:2:00PM - 4:00PM,(周六) 2015年11月7日
地点:Brookline Library Coolidge Corner Branch,... 阅读全帖
T****n
发帖数: 6187
7
来自主题: Soccer版 - 大数据分析梅西为什么牛逼ZZ
大数据本来也没有明确的定义吧。以前500M data就算大数据,现在显然不止这个量级
。我不知道这个分析具体的数据源是什么,但是数据类型应该并不单一。而且除了简单
的技术统计,还应该包括大量视频分析。说是大数据并不为过。
m*******n
发帖数: 370
8
就是点一个小圈选yes/no, 选是没问题,点了就显示已经选了,存到数据库里也没有问题。问题出
在,下一次用户再登录,看不到自己之前的选择。就是说data明明在数据库里,但是页面读不出来。
现在这个“vote” field的数据类型是text, 所以存到数据库里显示的是“文字的”yes/no.以下
的code在连接access时,是不会出现上面的问题的,但是换到连接SQL server,网页就读不出来
这个field了。
问题到底出在哪? 应该怎么改?谢谢先

Yes
Response.Write("CHECKED") : Response.Write("")%> type="radio"
name="Vote<%=CurrentItem%>" value="Yes">
No
Response.Write("CHECKED") : Response.Write("")%> ty... 阅读全帖

z*******3
发帖数: 13709
9
来自主题: Java版 - 本菜对EJB一问
我换一种方式解释
java是这么一种东西
当你打算用java去写系统的时候
你面对的是一堆乱七八糟的软件
这就包括web服务器,数据库,操作系统等等
那么你打算让这些东东合作
好在呢,这些东东跟java都有自己的一套接口
坏处呢,这些接口都十分原始
也就是基本上都只能做到通过接口传递原始数据类型的地步
不是int就是string这些东西,比如web,基本上就只有string
而且更不妙的是,往往有私货,比如sql就是专门针对db而言的
除此之外,你还有自己需要实现的一套逻辑
因为这个系统肯定不是说把数据从web中拔出来
直接插进到数据库中去,或者从db中拔出来,直接扔给浏览器就ok了的
一般来说,你都需要在这中间再倒腾倒腾
那怎么办?
所以建议就是
你针对你需要与之合作的那个软件,单独写一层,用来封装这个软件产品
所以就用struts/spring mvc这些来封装web服务器
用hibernate/ibatis这些来封装db
保证最后通过这些接口进出的数据都是pojo,也就是java beans
然后你再用spring core或者ejb来处理这写pojo之间的关系
所以spring... 阅读全帖
d******a
发帖数: 238
10

MTU不是决定最大报文长度的,而是决定分片的。
udp包是封装在ip包里的,ipv4的数据包头部有一个2字节的length选项,是ipv4数据包
的最大长度65535,从而决定了udp用户数据最大长度是65535-8-20=65507.
而udp传输又是不可靠的,所以分片很不好,因为丢失了一个分片就会影响其它分片的
重组。所以不同网络环境下mtu不同,发送的udp数据包大小不同,可能只有几百字节,
这是为了避免分片,而不是说我们只能发送几百字节的udp包。
r*****8
发帖数: 2560
11
来自主题: Programming版 - C 语言,数字变字符,有点难度
C 语言,数字变字符,有点难度。
我有一串数字,532、7892、1253、、、、要变成2个字符,要求字符里面的2进制
码,相当于这些数值。也就是相当于这些整数。
以532为例,要求2个字符里面实际上是整数(int)532,只是数据类型不同.
我的愚笨想法是,10进制532相当于16进制0214,相当于2进制的0000、0010、0001
、0100,然后把这些1推到每个字符的相应位置:
char my_string[2] = ‘\0\0’;
my_string[1] <<= 2;
x |= 1;
如此循环,最终得到符合要求的字符。
各位高人指点一下,有没有别的方法?
&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&
如果各位想知道我的怪题目从哪儿来的,继续往下看。有一个无人值守站点,有
数据要传回来,通过铱星传输。数据的最后,要算一个checksum,占2个字符。内容是
前面的有效数据之和,用16进位表示,取最后4个。例如:16进位的0214。
J****R
发帖数: 373
12
来自主题: Programming版 - 大牛们,请教大数据系统如何架构
storm, spark, hadoop 可以用来做aggregation,具体要看你们的user case。 如果用
spark, hadoop接在data store后面做query的话,要看你们出什么类型的report,要求
的响应时间是多少。如果是customized ad hoc query, 并且要实时显示report,那用
这些query就不太方便了,可能自己写一个query engine还好一点。如果query的数据量
不小的话,最好自己写点code 用coprocessor,user defined functions 这类东西处理
,能有效的减少响应时间。
c*,hbase这些东西也不是包治百病的,query的数据量大了一样很慢,还是得把计算挪
到cluster上去比较有效。如果你们的report比较固定,那可以用空间换时间,做点pre
process,query起来不管数据量大小都会很快。
c****3
发帖数: 10787
13
来自主题: Programming版 - 怎么设计这个client
这种你得自己设计校验协议,传多少数据校验一次,服务器端的校验数据怎么传,是附
在原始数据末端,还是通过另外通道。也根本不用写文件,直接在内存校验就可以。
所谓校验,也不见得是真的校验,就是检查数据类型是不是你想要的
g****t
发帖数: 31659
14
两天需求分析都没完成呢吧?
各种数据的数据类型能定下来?输入的default value?
用户如果是做生意的,国际生意的,炒股的,...


: 说实话,这种破玩意最多2天就做完了,

: 还聊什么核心,模块。

: 给个大概吧,抛玉引砖 :D

: #1

: DB/tables:

: users(基本信息)

: userR(用户相关信息,夫妻,子女等等,联合报税)

: userExt(拓展信息,商家,个人等等)

: years(年份相关数据数据)

: Formulas(各种规则)

I****p
发帖数: 101
15
来自主题: Biology版 - RNA seq 数据统计分析问题请教
每个处理有2-4个重复,好像有人说要按 count data 来分析,但是,normalize 后,
就变成有小数点的数据了,更像芯片类型的数据,可否就用芯片数据分析方法比如SAM
来分析?另外,有重复里有0这种数据,是把它变成1,0.1 或0.001来进行 log
transformation? 先谢!
Z******5
发帖数: 435
16
GEO有没有依据肿瘤类型对数据进行分类? 比如怎样能快速、完整地下载到breast
cancer的表达谱数据?
s****y
发帖数: 585
17
来自主题: Computation版 - Fortran和C++的数据转换问题
都是双精度类型的数据,Fortran输出到文件
-3.2500000000000000D+05,
现在有一个C++的程序要从该文件读出这个数据,
直接读无法读出来。
请问怎么把这些数据读出来?
现在我是把一个个数字/字母当字符读进来,把D写成E;这个办法似乎土了点。
有没有更好的办法,直接能够读出来;或者读出来直接转换一下就行?
Thanks.
R*******y
发帖数: 19
18
比如一组数据x和y,用plot(x,y,'b-*')作图,则*的个数是与length(x)相等的。有没
有一种办法,让标注不要那么密集。比如x本来有1000个点,我的图是按1000个点画的
(为了显得连续),但*只显示50个,也就是每隔20个真实数据点作一个标注。
有一种方法是先画一个没有标*的,再把数据隔20点采一次样,得到一组新的采样后的
x2,y2,然后再用纯*无线图画到同一个figure上,等于覆盖在原曲线上。但是这样有一
个弊病:如果用legend显示数据类型,会出现两种不同标注,一组是有1000个点的纯曲
线图,一组是有50个点的纯*点图,相当于是两条曲线--这一点是无法骗过legend函
数的。:P 用这个方法,除非你不标legend,否则是不可取的。
有没有其他办法,能够实现我想要的那种功能呢?(概念上应该得在一条曲线上,否则
legend这里肯定会有问题……)
谢谢高手指教!
Z******i
发帖数: 106
19
基于内容的检索与MPEG-7(下)
[ 作者:王玉霞 转贴自:《世界广播电视》 点击数:179 文章录入:admin

基于内容检索系统的一般结构
基于内容检索(CBR)系统虽然没有统一的形式,但一般由两个子系统构成:数据库生成子
系统和数据库查询子系统。每个子系统由相应的功能模块和部件组成,如图1所示。
特征抽取
对视频、图像等多媒体数据自动或半自动地进行特征抽取,提取用户感兴趣的、适合检索
要求的特征。特征提取可以是全局性的,如整幅图像和视频镜头,也可以针对某个目标,
如图像中的子区域、视频中的运动对象等。
数据库
生成的数据库由媒体库、特征库和知识库组成。媒体库包含多媒体数据,如图像、视频、
音频、文本等。特征库包含用户输入的特征和预处理自动提取的内容特征。知识库包含领
域知识和通用知识;可以更换知识库中的知识表达方式,以适应不同领域的应用。
检索(匹配)引擎
检索是利用特征之间的距离函数来进行相似性匹配。模仿人类的认知过程,近似得到数据
库的认知排序。对于不同的媒体数据类型,具有不同的相似性测度算法。检索(匹配)引擎
中有一个较为有效、可靠的相似性测度函数
z*****2
发帖数: 498
20
来自主题: MedicalCareer版 - CMG医生服务的医疗机构类型的统计
CMG医生服务的医疗机构
Hospital: 31%
University: 13%
Group: 40%
Solo: 3%
从数据库中得到数据并不困难,难的是机构的确认。按照老美的话只能是用我们的”
best knowledge”. 有几点我们要说明:1, 本数据取自
http://physician.cmgforum.net
, 2, PGY没有加入统计。 3, 很多医生即服务于医院,也有自己的诊所,我们只能按照数据
库中的数据来统计。3,hospital 和 practice group的确认有时很困难,我们主要是根据是若
有in patient服务则认为是医院,反之为Group. 4,数字相加并非100,剩下的应该是PGY和其
他。 错误是难免的,只是一个粗线条的东西。欢迎批评指正。
y****d
发帖数: 432
21
来自主题: Statistics版 - [分享]SPSS中文视频教程--不容错过
简单说明:
有操作演示、也有讲解,还是不错的(是MM在讲,还有背景音乐,学着也不累)
包含内容:
第一部分 数据处理
第二部分 描述性统计
第三部分 数据分析
第四部分 因素分析
第五部分 回归分析
第六部分 相关分析
第七部分 专题讲座
详细介绍:
第一部分 数据处理
数据检查
数据输入
数据整理
第二部分 描述性统计
连续性变量的统计
非连续性变量的描述统计
正态性检验
第三部分 数据分析
方差分析
项目分析
信态分析
第四部分 因素分析
因素分析简介
因素分析原理
因素分析操作说明
因素分析实例
第五部分 回归分析
回归分析相关概念
回归模型选择
回归模型应用-路径分析
回归模型诊断
第六部分 相关分析
相关系数与数据类型
相关与回归
相关实例演示
相关散点图
第七部分 专题讲座
正态性检验
缺失值处理
标准差与标准误
卡方检验
t检验_方差分析_回归分析的综合比较
spss制图
集中量与频数分布的形态关系
均数比较
七种常用交互式绘图
四种重要抽样分布图
随机变量和固定变量
随机数生成
统计决断的两类错误及其控制
因素负荷矩阵旋转
原始分转化为... 阅读全帖
p**z
发帖数: 65
22
刚开始用Python不习惯,为什么传递参数的时候没有办法指定是 by reference 或者
by value。后来终于理解了,Python的变量和许多其他语言的不同,其他语言的变量名
常可以被想象成有名字的装载数据的容器,变量赋值是把数据放进容器里(即使是 by
reference,也是把指针数据放进指针变量里);Python的变量名却最好比喻为在对象
上贴上的名字标签,所以变量赋值永远是 by reference,就是在已经有的对象上添一
个标签。这个可能跟Python所有数据类型都是对象(object)有关系。
这个方法通常最有效率,但是也容易让人迷惑,因为跟一般人的编程习惯不一样。
对于 immutable 的对象(比如浮点常数,字符串常数等等),把它赋值给一个变量名
仅仅是给这个常数对象贴上新标签,常数对象本身并不能被改变。如果两个标签 A 和
B 贴在同一个常数对象上,给 A 赋新值就好像把这个标签揭下来贴到另一个不相干的
常数对象上,对 B 没有影响,所以表现好像跟 by value 传参很像,但实际上还是 by
reference 的。
但是对于 mutable 的对... 阅读全帖
t********5
发帖数: 522
23
来自主题: JobHunting版 - python的list和array是一个东西?
list里面可以放任何数据类新或者原型数据 你可以把变量放到list里面 然后让该变量
引用任意数据类型
python的话 codecademy的教程入门就挺好 入门完了写写各种数据结构 常见算法和排
序 基本上这两个过完了 面试需要的python技巧你就都有了
之后就可以开始拿python刷cc150之类的了
小project你可以写写爬虫 django什么的
B******n
发帖数: 1
24
来自主题: JobHunting版 - 电话面试 - 是不是被阴了?
电话面试某Pre IPO公司某研发职位,阿三面试官,Skype+Collabedit写程序。
电面之前已经有了一轮coding interview。算法题,顺利找到O(N)算法,过关。
第一次Skype电话面试,不了解行情,以为Skype就是打电话而已,所以在车库里面准备
面试,车库里面比较安静,没有闺女捣乱。结果阿三非要我开摄像头。我只好开开摄像
头给他看我凌乱的车库。
寒暄不说了。先Go Thru简历 5分钟不说了
第一题一个单向链表,移除一个node。这种题目还用做么?讨论了下如果删除最后一个
节点怎么办,然后用了两分钟左右写完code,面试官看了半天没有发现bug
有一个数据库若干表写SQL,一分钟左右写完,时间大部分都用在敲字上面了,都没有
考虑什么,他没有发现问题。
然后是程序改错题。总的来说是一段代码,对多线程的情况完全么有考虑。需要在诸多
地方加上控制。但是因为他的业务逻辑很简单,所以其实有些地方synchronize加不加
其实是一样的。我就给了一个只在需要加锁的地方加锁的解法。然后他不happy了,说
你为啥只锁变量1,不锁变量2捏?我说因为变量2锁了不锁都一样啊,... 阅读全帖
s*********l
发帖数: 28
25
长帖预告... 冷门专业一职难求,找了几个月终于有一个相关的职位,联系了内推然后
拿到了电话面试,面完心里很惶恐,求大神指点,拍砖提建议...
这是一个analyst职位,大致是做天气、气候、土壤水、卫星遥感方面的数据分析,需
要的技能比较杂,从气象、到气候、到农业、到统计、到GIS、到编程和脚本、再到交
流和写作能力,全都要。我大概符合80%吧,有个编程语言我不会,口语和本土美国人
比还是欠一些的。
这个职位是我们系四年前毕业的一个学姐升职而空出来的,我联系了她一下,搭了个讪
表了个忠心,附上了resume和cover letter,然后她说我的resume和letter都写得很好
,我简历上的skills也符合他们大部分要求,就帮我跟负责招人的两个manager说了一
下,于是一周后就拿到了电话面试。准备期间先后问了学姐很多东西,她的回答很热心
很详细,我觉得自己估计没有惹人讨厌。
电面是组里的两个research manager做的,接通后就立即开始介绍这个职位,blabla一
通之后就让我说说自己之前每个proj的详情。我就把每个proj按照“做什么的、用什么
数据、想得到什么... 阅读全帖
s*****r
发帖数: 43070
26
俺觉得这个数据库里没有票的概念,只有车次编号,座位编号和区间编号,车次,座位
类型和区间决定车票价格
顾客买到手的是张车票,上面的全面信息代表数据库里面的一个订单,就是所谓的车票
E**********e
发帖数: 1736
27
来自主题: JobHunting版 - 今天写了个比较effecient XML parser
还不懂xpath。
现在是从xml转化到python dict。 namespace有相应的函数处理掉。
这个parser是用来处理工作的数据。目前没有必要考虑iso是么。也许处理别的vendor
的xml还会有bug。不过即使有debug,再改进也行。 核心的东西就是recursion。 而且
也有附属的数据转化功能, xml 相应的text 转化成相应的数据类型。
总的来说, 处理experian的信用报告的xml 也就足够了。
e*e
发帖数: 6808
28
来自主题: Running版 - 对比我的两组心跳数据
小龙啊,我觉得你不用那么纠结HR。不同的人可能适合不同的训练方法和指标。有些数
据,收集了可以做参考。make sense的好好分析,不对劲的,不用那么纠结。
回whxhm1,MHR,跟人有关,跟擅长的速度可能没关系。小龙以前是跑5000的,我认为
这也算中长跑吧。我朋友短距离很差很差的,坚持长跑,pace不到9分跑9迈的HR是190+
,也是一跑HR就居高的类型。
前两天开会,早上跟同事long run。一个HR超低(女,22岁测MHR就只有170多),她说
她喜欢跑hills是因为那是唯一她能感到心跳的时候。另一个,女,26岁,BQ了,NYCMQ
了,年年跑oregon的H2C (orz orz orz),她说她从来不care HR,完全不知道数据。
所以,小龙,我觉得你数据照收,但不用那么纠结。
z*********n
发帖数: 94654
29
来自主题: Joke版 - 算了,我还搞点学术普及把
不过这几年大数据也罢好多网站的新技术也罢,都有一个很大的特点,不太在乎确定性
和准确性
都是best effort,关键要赶紧出结果,快,万一出个错,大不了user界面弹出个窗口
,点一下重试不就完了
所谓用大数据推荐的广告也尽是已经买了的东西,还要追踪你一万年
就是这些不需要100%精确,让好多open source不是很可靠的tool大行其道,让好多所
谓大数据类型的计算门槛严重降低,呵呵
c******n
发帖数: 16666
30
来自主题: Joke版 - 知乎看到的裸条大数据
作者:阿亮同学
链接:https://www.zhihu.com/question/47736379/answer/133681007
来源:知乎
著作权归作者所有,转载请联系作者获得授权。
可耻地答一下,真的辣眼睛啊
然后职业病做一波小分析,稍微统计了一下数据
1.学校按照类型分类,分布数量的多少依次为:
专科>中专高职技校>二三本>艺术院校
可以看出学历越高等,素质越高,生活水平越高的趋势在统计上的确是存在的,但985
,211也存在部分脑袋拎不清楚。其中竟然还有自称是北影之流戏剧学院的,神他妈脑
子有坑,北影的你这么来借钱?系唔系Excited? 知乎政治正确上多次老生常谈的“知
识改变命运,学历越高生活越好”又一次得到了验证。当然,也可能由于该样本群体的
特殊性,无法下因果性结论,只能说存在相关性。
2.户籍分布:
行政等级上,乡镇县>地级市>农村户>大城市
地区上,中西部>东部
基本上偏僻较为落后地区的姑娘以压倒性优势碾压了富足地区,其中未出现一线城市城
镇户口,省会城市城镇户口的样本。虚荣的物欲果然还是会让人迷失理智的,广大姑娘
们要提高自身知识水平,内心富足才是真的富足,... 阅读全帖
z*******3
发帖数: 13709
31
来自主题: Java版 - 说说spring和ejb的差别
抛砖引玉
吃饱了看文茜世界财经周报,看得昏昏的想睡,睡觉前赶紧写,写完睡觉去了
这样,先不从dto说起了,说tiers
一个j2ee经典的tiers最早提出来的时候,是三层,所谓的三层说的是sever side三层
不包括client side和database
三层里面分别有一层专门跟以上两个东西打交道
一个是presentation tier,这个跟client side打交道
一个是persistent tier,这个专门跟database打交道
中间还剩下一个叫做business tier,这么三层,这都很熟悉了
那么当初提出这个构想的时候
是基于以下一个方式
client side是applet+browser
presentation tier是servlet+jsp,servlet是controller,jsp是viewer
model需要你自己去提取,去包装
business tier则是ejb,尤其是session bean,stateful和stateless
persistent tier也是ejb,是entity bean
database用jdbc连接
这五个... 阅读全帖
S*A
发帖数: 7142
32
来自主题: Linux版 - Google go 还挺不错的
最近学习了一下 google go. 觉得还挺好的。我大胆预测以后一定会火。
整体感觉,填补了 C 和 Python 中间的空白。
和 C 一样,直接生成机器代码这个非常好。这一点就把什么 Java, C#
都比下去了。估计以后成熟写应该能和 C++ 的速度差不多。我一直想找
个类似 C 的但是可以直接用 dictionary & array 的抽象数据类型的
语言。以前我学过的最接近的是 Objective C, Objective C 其实挺不错
的,就是写起来比较长一点。最大的问题是出了 OSX 没有地方可以用。
Python, Lua, Java 子类都太慢,什么都是 Box Type. 没法快起来。
这个 C++ template 那一套太复杂,而且生成很多不必要的代码(各种
basic type 生成一套)而且 OO 多重继承那一套就是走火如魔了。
最近在玩一些 Graph 有 8M 结点, 200M 条边. Python 最最优化的程序装
进来也要几分钟。我已经恨不得给 Python 手写 C module 来装如那些数据了。
Python 有个地方 很讨厌,slice ... 阅读全帖
N******K
发帖数: 10202
33
我有一个数据类 里面很多成员
成员1 是一个矩阵
成员2 是一个图
成员3~10 是 一些数字
我现在是这样保存这个类
dataobject.json 存储这个类的大致信息
有多少个成员啊
每一个是啥类型
每一个成员的简要信息:比如矩阵是 10x10的 double精度
dataobject.member1.data 存贮 矩阵 二进制方式
dataobject.member2.data 存贮 图 二进制方式
dataobject.member3to10.data 存贮 name-value pair 文本方式
这样这个类对应很多数据文件
如果更加复杂 就得变成了dataobject.memberX.memeberY.memeberZ.data
请问还有其他什么办法?
R***r
发帖数: 49
34
来自主题: Unix版 - 请教几个问题!!
1。用什么命令可以读取大文件某段数据?文件数据类型是floating
point。比如读图像raw文件从第100个byte到第200个byte?
2。在C-shell里调用gawk,能保存变量吗?不如gawk读出一个数据,
能保存成一个变量 a, 然后在下一行语句里用这个变量吗?
c****l
发帖数: 53
35
来自主题: Biology版 - 招人 (big data 相关)
老板最近成立一个center (Center for Statistical Inference in Biomedical Data
Science), 有很多钱, 想招一些人. 老板是UPenn Biostatistics的 Full Professor
http://statgene.med.upenn.edu/, 新成立的center主要做跟Big data相关的东西, 比如genomic data, image data, EMR/EHR data, social network data . 老板人很好, 职位都是学校里面职位, 身份问题比较好解决, 薪水应该都是UPenn的薪水标准.
目前有如下几个职位:
1. Programmer: 硕士就可以了, 因为实验室主要做一些统计方法, 所以需要招人把统
计方法做成可以用的软件, 供其他人使用, 所以主要工作就是编程. 我们主要用Python
和R, 偶尔用一些C++和JAVA. 这个职位是长期职位 (permanent position).
2. Scientist: 要求有博士学位, 我们实验室和医院(主要是CHOP... 阅读全帖
c******5
发帖数: 22
36
来自主题: Statistics版 - large dataset impot into SAS

columns.
的确是有mixed的数据。可是我转了个相似的data没问题啊。详细说说吧:
1. 我在access里要用到它的3个tables中的信息。首先,我一个table一个table的把它
们变成了excel file,然后用proc import一个一个的把它们转到SAS中。成功。
2. 因为我想把3个tables中的信息放在一个table中在SAS中做Analysis,但SAS中用
merge什么我怕有multiple entries (不同的table有不同数量的multiple entries)
容易出错。所以我在access里用query把这三个tables先放到一起,然后转成一个excel
sheet,最后录入SAS。 于是就给出了error message。
所以我觉得mixed的数据类型应该不是问题,因为之前没有出错啊。我能想到的就是
combine了以后row 太多,但前面也有朋友说SAS能handle很大的数据,应该也不是问题
。还有就是SAS能发现我这个新的excelsheet是从access中combine了不同的tables来的
所以有问题? 觉得这... 阅读全帖
D*********2
发帖数: 535
37
来自主题: Statistics版 - 弱问大数据处理
最近接一新project,40+ million line,大概70个左右variable,数据给的是.csv格
式。问题是cookbook做的很差,很多unexpected value,比如一variable cookbook上
写是0-9 coding,结果什么负数啊,感叹号啊,有时missing value还用date表示。非
常不能理喻。
所以第一个task就是逐一审阅unexpected values,补全cookbook
这个大小的数据用R没戏,用SAS在不知道这列到底改是啥数据类型的时候要反复调很多
次,而且读进去有时候也匪夷所思的,出现些更离奇的符号,*啊,~啊。现在解决的办
法就是分段读进R(大概10 million一段),然后做summary,然后人工总结,说实话满
累的。
而且这也不是个办法,之后merge阿什么的应该还是要SAS SQL,感觉还是要一次性全搞
进SAS才是正道。我SAS很差,Python之类之略知皮毛,求这种情况SAS应该怎么倒,或
better solution。
谢谢谢谢。
o****o
发帖数: 8077
38
来自主题: Statistics版 - 再请教一个numpy的问题
我用genfromtxt读入一个csv文件,混合型数据类型
这个时候得到的数据其实是一个array of array,比如这种
x = array([ ('abc', 1, 2, 3),('cde', 0, 1, 3), ('ede', 4, 5, 6)]
要拿到每一个位置的具体数据就要这么index:x[1][0],但是又不能用wild card :
这种情况你们是怎么处理的?
当然我可以自己写一个customized的读入模块,这不是希望多借用已有资源么。
c****l
发帖数: 53
39
来自主题: Statistics版 - 招人 (big data 相关)
老板最近成立一个center (Center for Statistical Inference in Biomedical Data
Science), 有很多钱, 想招一些人. 老板是UPenn Biostatistics的 Full Professor
http://statgene.med.upenn.edu/, 新成立的center主要做跟Big data相关的东西, 比如genomic data, image data, EMR/EHR data, social network data . 老板人很好, 职位都是学校里面职位, 身份问题比较好解决, 薪水应该都是UPenn的薪水标准.
目前有如下几个职位:
1. Programmer: 硕士就可以了, 因为实验室主要做一些统计方法, 所以需要招人把统
计方法做成可以用的软件, 供其他人使用, 所以主要工作就是编程. 我们主要用Python
和R, 偶尔用一些C++和JAVA. 这个职位是长期职位 (permanent position).
2. Scientist: 要求有博士学位, 我们实验室和医院(主要是CHOP... 阅读全帖
F*V
发帖数: 3978
40
新闻联播明年将延续《你幸福吗》类型调查
2012年11月12日02:37 北京晨报 评论(4人参与)
一年一度的中央电视台黄金资源广告招标大会将于11月18日在京举行。近日,央视
广告中心主任何海明接受了记者采访,提前透露2013年央视新的节目安排和变化。据了
解,《新闻联播》将延续《你幸福吗?》这一类调查,并且增加《寻人启事》这样的板
块。
视频:央视记者街头采访你幸福么路人答我姓曾 来源:CCTV新闻频道
综合频道变化巨大
2013年,央视继续进行更大力度的节目调整,推出许多新节目,其中,CCTV-1的变
化非常大。比如,《新闻联播》、《朝闻天下》、《晚间新闻》等新闻栏目将联动进行
改进。2013年《新闻联播》还将延续《你幸福吗?》这类主题策划,增加《寻人启事》
这一亲民性板块,接上地气,做足影响。另外,央视将重点打造23时30分主持人精品节
目带:包括:《小撒时间——证据在说话》、《王刚时间——收藏传奇》、《张斌时间
——传奇体育》、《岩松时间——观天下》、《柴静时间——看见》、《崔永元时间—
—小崔说事》,节目均自2013年1月1日正式播出。
公益节目方面,2013年,《寻找“... 阅读全帖
b*****d
发帖数: 61690
41
新闻联播明年将延续《你幸福吗》类型调查
2012年11月12日02:37 北京晨报 评论(4人参与)
一年一度的中央电视台黄金资源广告招标大会将于11月18日在京举行。近日,央视
广告中心主任何海明接受了记者采访,提前透露2013年央视新的节目安排和变化。据了
解,《新闻联播》将延续《你幸福吗?》这一类调查,并且增加《寻人启事》这样的板
块。
视频:央视记者街头采访你幸福么路人答我姓曾 来源:CCTV新闻频道
综合频道变化巨大
2013年,央视继续进行更大力度的节目调整,推出许多新节目,其中,CCTV-1的变
化非常大。比如,《新闻联播》、《朝闻天下》、《晚间新闻》等新闻栏目将联动进行
改进。2013年《新闻联播》还将延续《你幸福吗?》这类主题策划,增加《寻人启事》
这一亲民性板块,接上地气,做足影响。另外,央视将重点打造23时30分主持人精品节
目带:包括:《小撒时间——证据在说话》、《王刚时间——收藏传奇》、《张斌时间
——传奇体育》、《岩松时间——观天下》、《柴静时间——看见》、《崔永元时间—
—小崔说事》,节目均自2013年1月1日正式播出。
公益节目方面,2013年,《寻找... 阅读全帖

发帖数: 1
42
第一,清华人最喜欢问英雄出处,这事儿你不知道?
哈尔滨有个哈三,河北有个石家庄2中,湖北有个黄冈,北京有个四中人大附,辽宁有
个实验,这些都是清华每年录取的兵家之弟,也是清华人津津乐道的出身必备话题,你
这是没在清华读的本科吧,
你不知道有些同学都把高中母校名字都挂在PhD的CV上吗?
第二, 你表哥的case在你人生中有多少人是这样的?是就这一个,还是100来个? 我
有必要把这么0.0001%的case放进去算成类型吗?
我先说我的,我就知道我表弟那一个case,而且还是我高度质疑我姑妈评价的真实性的。
事实数据根本就是约等于0.
姐今天脾气大,感觉你说话不太着边儿,所以出言不逊,请多包涵。
b***m
发帖数: 5987
43

的?
真不是谦虚,离大牛还差得远。我的特点跟印度人有些像,比较能侃,但是科班基础不
够牢。
我们可以列出这个system需要的信息:酒店的数量(连锁?),酒店的地址(或者编号
),是否有会员以及级别,reservation的来源(网络?电话?),房间数,房间类型
(Queen?King?Suite?),客人数(以及姓名等资料),每个房间停留的天数,是否
有特别要求(晚来?早走?宠物?婴儿床?朝向?残疾人方便?抽烟?),付款方式(
现金?信用卡?积分?)……这些信息列出来基本就差不多了。
在这些信息基础上,抽象出数据类型和数据库表的定义(包括索引字段等等),然后大
概可以归纳出如下容器(class):Hotel,Client,Room,Membership……他们之间大
部分是包含的关系,然后在定义出各个interface:Reserve,Extend,Payment,
Modify……
大概就是这么个意思吧。瞎写一通,见笑了。
a********m
发帖数: 15480
44
来自主题: JobHunting版 - G家杯具
有可能差很远,但是你这个说的还是太简单了,报告还是非常细致的。
举个例子吧,比如一个简单的coding题目,写程序做稍微变化一点的bfs。报告里面一般
会包括这些信息中的一些(如果值得记录的话,正常的话不一定记):
-理解题目是不是很顺利,
-问问题确认数据类型还是直接用整数,
-花多少时间明白是dfs,
-花多少时间确定使用的方法,
-解释方法是不是思路清楚,交流能力有没有问题,
-是不是故意多说其他的东西来隐藏自己不清楚概念或者方法,
-是很确定还是犹豫,
-写代码是很流利还是断断续续,
-写到某个步骤停下来思考和改动,
-写代码是不是熟练,
-有没有可能最近写过这个代码,
-代码思路是不是清楚,
-bug是什么类型,是否合理,
-bug是自己看出来还是需要指出,
-修改bug花多少时间,
-怎么找到,理解和修改bug
-解释bug和解决方法是不是清晰流利,
-修改是正确的修改还是只是修补让结果正确。
-时间空间复杂度,
-用多长时间思考,
-有没有解释,思路是不是清楚,
最后,把你的代码记录在报告里给hc看。
总之,一个函数写对了不代表什么。
z*********n
发帖数: 1451
45
来自主题: JobHunting版 - 来讨教个面试题

我是不是提前先问你这是啥数据类型了?
是不是说了不同类型手法不一样。
然后你告诉我是int
我码了七行字解了后你啥别的不说只回仨字“double咋整”?
自己琢磨吧。
w******t
发帖数: 241
46
【 以下文字转载自 Linux 讨论区 】
发信人: webcraft (此处不留爷,自有留爷处;处处不留爷,爷, 信区: Linux
标 题: 请教一个问题:如何在fedora下面看自己的wirelesscard的类型
发信站: BBS 未名空间站 (Thu Jul 17 11:51:10 2008)
正在做一个项目,应该需要了解WLAN card的型号。另外我还有一个类似的问题,在
iwconfig下我看到我的wireless interface是ath0.但是在ifconfig下似乎又是wifi0.
我现在想用tcpdump检测wireless端口的数据。不知道应该检测哪个interface? 谢谢
大家
t********k
发帖数: 808
47
来自主题: Database版 - Java调用Oracle存储过程的问题
存储过程有一个数组参数
类型是 Table of Varchar2(20)
在Java调用该存储过程时
要用什么数据类型传进来呢?
String [] 不行啊,如
Strign [] strArray = {"12","34","56"};
cs.setObject(1,strArray,java.sql.Types.ARRAY);
这样会抛出异常
那怎么传呢?
谁做过呢?
谢谢
e*********y
发帖数: 29
48
来自主题: Database版 - 转换成时间的格式 MS SQL
你能保证你处理的包含所有数据类型吗?
这个取决于你的table field是哪种类型吧.
substring (STUFF (datafield,1,0,'0'),1,2)+'/'+substring (STUFF (datafield,1,
0,'0'),3,2)+'/'+substring (STUFF (datafield,1,0,'0'),5,2)
t********k
发帖数: 808
49
存储过程有一个数组参数
类型是 Table of Varchar2(20)
在Java调用该存储过程时
要用什么数据类型传进来呢?
String [] 不行啊,如
Strign [] strArray = {"12","34","56"};
cs.setObject(1,strArray,java.sql.Types.ARRAY);
这样会抛出异常
那怎么传呢?
谁做过呢?
谢谢
t********k
发帖数: 808
50
我也是这么认为的
想用java.sql.Array数据类型试试
但怎么把String[]转换成java.sql.Array类型呢?
查了查API
好象没有互转的方法啊
首页 上页 1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)