第4页 - 关于数据类型的讨论汇总 - 话题女王

全部话题 - 话题: 数据类型

r******y
发帖数: 9892

来自主题: _JapanDrama版 - 二宫和也/丰川悦司——东野原作电影《白金数据》发布

偶然看到一位二狗亲妈提到之前一个杂志访问，涉及二狗的演技：
cool音乐有一期，是翻的宫藤官九郎和狗的对谈，那个做得挺不错的
其中有一段是说J家的另外两个演技派，tokio的长濑和v6的冈田，宫藤长用并且欣赏的
两个演员，用本能和用脑思考的两个极端的演员，他认为nino是冈田类型的，但狗却说
自己硬要分类的话更接近于长濑类型的，而子俊是冈田类型的。
我同意子俊拍戏差不多是看剧本看到烂，然后会一直思考。但nino说他的剧本相当干净
，我有点奇怪，其他人也会这样说，之前问他剧本背了没有，狗就说没有，不过到了拍
戏却一点错都不出。
那篇对谈是做的真不错，看了很多遍，大多是关于流星之绊的，当时狗说了一些他自己
的关于流星的感受，然后宫藤就说谢谢nino，因为当时他还在为不知道结局应该怎么写
而烦恼，听了二狗的理解，就有了豁然开朗的感觉。
当我看到这篇对谈的时候，我已经把整个剧都看完了，所以很能理解他的这种说法，因
为结局里功一的态度的确和当时狗所理解的人物一样，而且做这样的处理功一这个人物
性格还是怎样都对的上号了。当时我就想，原来二狗已经成为了可以让人物带动剧情发
展这样的演员了吗~~

r******y
发帖数: 9892

来自主题: _JapanDrama版 - 二宫和也/丰川悦司——东野原作电影《白金数据》发布

b*****d
发帖数: 61690

来自主题: Military版 - 统计局私企利润数据被指与实际不符

统计局私企利润数据被指与实际不符
http://www.sina.com.cn 2011年07月28日01:10 经济参考报
国家统计局27日公布，1-6月份，我国规模以上工业企业实现利润24105亿元，同比
增长28.7%。全国规模以上私营工业企业实现利润同比增速居各类型企业之首。
数据显示，国有及国有控股企业实现利润7784亿元，同比增长20.2%；集体企业实
现利润386亿元，同比增长33.8%；股份制企业实现利润13772亿元，同比增长34.8%；外
商及港澳台商投资企业实现利润6291亿元，同比增长14.5%；私营企业实现利润6425亿
元，同比增长47.2%。
不过，这与《经济参考报》记者在广东、浙江两省调研发现的情况存在差异。记者
发现，沿海地区部分中小企业，当前的经营情况较为困难。
在调研中，广东省广新控股集团有限公司副总经理黄平向《经济参考报》记者介绍
，目前广东省有很多中小企业融资特别困难。一方面从银行贷款很难，另一方面大企业
对小企业的资金要求也更加严格了，比如说提前支付预付款等等。
浙江省统计局副局长王杰近日表示，浙江新增企业数量远远大于注销企业数量，没
有... 阅读全帖

a****r
发帖数: 12375

来自主题: Military版 - 知乎看到的裸条大数据

【以下文字转载自 Joke 讨论区】
发信人: chunjuan (👍春卷🐱更多春卷👍), 信区: Joke
标题: 知乎看到的裸条大数据
发信站: BBS 未名空间站 (Thu Dec 1 23:59:19 2016, 美东)
作者：阿亮同学
链接：https://www.zhihu.com/question/47736379/answer/133681007
来源：知乎
著作权归作者所有，转载请联系作者获得授权。
可耻地答一下，真的辣眼睛啊
然后职业病做一波小分析，稍微统计了一下数据
1.学校按照类型分类，分布数量的多少依次为：
专科>中专高职技校>二三本>艺术院校
可以看出学历越高等，素质越高，生活水平越高的趋势在统计上的确是存在的，但985
，211也存在部分脑袋拎不清楚。其中竟然还有自称是北影之流戏剧学院的，神他妈脑
子有坑，北影的你这么来借钱？系唔系Excited? 知乎政治正确上多次老生常谈的“知
识改变命运，学历越高生活越好”又一次得到了验证。当然，也可能由于该样本群体的
特殊性，无法下因果性结论，只能说存在相关... 阅读全帖

Q**J
发帖数: 1196

来自主题: Boston版 - [大数据与居住形态] 讲座

上午这个帖子不知为何被删了，发信问了四个版主原因，没有得到回复。我只能当作是
被站风误删了。如果是版主删的，并且还要删，请告知一下原因，谢谢。这是免费讲座
，主要是交流信息，认识朋友，没有商业目的。
-----------------------------------------------------------------------
大数据究竟是人类思维习惯颠覆还是统计科学的夸大其词？离开科学研究的高度，它
又能对我们的微观居住行为提供哪些富有价值的认知？
敬请关注New Design Alliance和Archidogs联合举办的讲座“大数据与居住形态”
嘉宾介绍
杨晓文博士，麻省理工大学研究员，美吉居创始人
届时，杨晓文博士将从区域数据分析的高度，宏观分析波士顿产业类型，就业增长和波
士顿房价之间的关系；也将分析收入，族裔，就学等因素在社区选择中的比重；还会从
个案入手探讨个人居住选择的盲点并提供相应的数据启示。
时间：2:00PM - 4:00PM,（周六） 2015年11月7日
地点：Brookline Library Coolidge Corner Branch,... 阅读全帖

Q**J
发帖数: 1196

来自主题: Boston版 - [大数据与居住形态] 讲座

T****n
发帖数: 6187

来自主题: Soccer版 - 大数据分析梅西为什么牛逼ZZ

大数据本来也没有明确的定义吧。以前500M data就算大数据，现在显然不止这个量级
。我不知道这个分析具体的数据源是什么，但是数据类型应该并不单一。而且除了简单
的技术统计，还应该包括大量视频分析。说是大数据并不为过。

m*******n
发帖数: 370

来自主题: Database版 - check box为什么显示不了已check? (on SQL server)

就是点一个小圈选yes/no, 选是没问题，点了就显示已经选了，存到数据库里也没有问题。问题出
在，下一次用户再登录，看不到自己之前的选择。就是说data明明在数据库里，但是页面读不出来。
现在这个“vote” field的数据类型是text, 所以存到数据库里显示的是“文字的”yes/no.以下
的code在连接access时，是不会出现上面的问题的，但是换到连接SQL server，网页就读不出来
这个field了。
问题到底出在哪？应该怎么改？谢谢先

Yes
Response.Write("CHECKED") : Response.Write("")%> type="radio"
name="Vote<%=CurrentItem%>" value="Yes">
No
Response.Write("CHECKED") : Response.Write("")%> ty... 阅读全帖

z*******3
发帖数: 13709

来自主题: Java版 - 本菜对EJB一问

我换一种方式解释
java是这么一种东西
当你打算用java去写系统的时候
你面对的是一堆乱七八糟的软件
这就包括web服务器，数据库，操作系统等等
那么你打算让这些东东合作
好在呢，这些东东跟java都有自己的一套接口
坏处呢，这些接口都十分原始
也就是基本上都只能做到通过接口传递原始数据类型的地步
不是int就是string这些东西，比如web，基本上就只有string
而且更不妙的是，往往有私货，比如sql就是专门针对db而言的
除此之外，你还有自己需要实现的一套逻辑
因为这个系统肯定不是说把数据从web中拔出来
直接插进到数据库中去，或者从db中拔出来，直接扔给浏览器就ok了的
一般来说，你都需要在这中间再倒腾倒腾
那怎么办？
所以建议就是
你针对你需要与之合作的那个软件，单独写一层，用来封装这个软件产品
所以就用struts/spring mvc这些来封装web服务器
用hibernate/ibatis这些来封装db
保证最后通过这些接口进出的数据都是pojo，也就是java beans
然后你再用spring core或者ejb来处理这写pojo之间的关系
所以spring... 阅读全帖

d******a
发帖数: 238

来自主题: Programming版 - UNIX DATAGRAM 类型socket最大报文长度多少？

MTU不是决定最大报文长度的，而是决定分片的。
udp包是封装在ip包里的，ipv4的数据包头部有一个2字节的length选项，是ipv4数据包
的最大长度65535，从而决定了udp用户数据最大长度是65535-8-20=65507.
而udp传输又是不可靠的，所以分片很不好，因为丢失了一个分片就会影响其它分片的
重组。所以不同网络环境下mtu不同，发送的udp数据包大小不同，可能只有几百字节，
这是为了避免分片，而不是说我们只能发送几百字节的udp包。

r*****8
发帖数: 2560

来自主题: Programming版 - C 语言，数字变字符，有点难度

C 语言，数字变字符，有点难度。
我有一串数字，532、7892、1253、、、、要变成2个字符，要求字符里面的2进制
码，相当于这些数值。也就是相当于这些整数。
以532为例，要求2个字符里面实际上是整数（int）532，只是数据类型不同.
我的愚笨想法是，10进制532相当于16进制0214，相当于2进制的0000、0010、0001
、0100，然后把这些1推到每个字符的相应位置：
char my_string[2] = ‘\0\0’;
my_string[1] <<= 2;
x |= 1;
如此循环，最终得到符合要求的字符。
各位高人指点一下，有没有别的方法？
&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&
如果各位想知道我的怪题目从哪儿来的，继续往下看。有一个无人值守站点，有
数据要传回来，通过铱星传输。数据的最后，要算一个checksum，占2个字符。内容是
前面的有效数据之和，用16进位表示，取最后4个。例如：16进位的0214。

J****R
发帖数: 373

来自主题: Programming版 - 大牛们，请教大数据系统如何架构

storm, spark, hadoop 可以用来做aggregation，具体要看你们的user case。如果用
spark, hadoop接在data store后面做query的话，要看你们出什么类型的report，要求
的响应时间是多少。如果是customized ad hoc query，并且要实时显示report，那用
这些query就不太方便了，可能自己写一个query engine还好一点。如果query的数据量
不小的话，最好自己写点code 用coprocessor,user defined functions 这类东西处理
，能有效的减少响应时间。
c*,hbase这些东西也不是包治百病的，query的数据量大了一样很慢，还是得把计算挪
到cluster上去比较有效。如果你们的report比较固定，那可以用空间换时间，做点pre
process，query起来不管数据量大小都会很快。

c****3
发帖数: 10787

来自主题: Programming版 - 怎么设计这个client

这种你得自己设计校验协议，传多少数据校验一次，服务器端的校验数据怎么传，是附
在原始数据末端，还是通过另外通道。也根本不用写文件，直接在内存校验就可以。
所谓校验，也不见得是真的校验，就是检查数据类型是不是你想要的

g****t
发帖数: 31659

来自主题: Programming版 - 请高手指教：选择什么语言来实现一个报税软件的核心计算模块（

两天需求分析都没完成呢吧？
各种数据的数据类型能定下来？输入的default value?
用户如果是做生意的，国际生意的，炒股的，...

: 说实话，这种破玩意最多2天就做完了，

: 还聊什么核心，模块。

: 给个大概吧，抛玉引砖 :D

: #1

: DB/tables：

: users(基本信息)

: userR(用户相关信息，夫妻，子女等等，联合报税)

: userExt（拓展信息，商家，个人等等）

: years(年份相关数据数据)

: Formulas(各种规则)

I****p
发帖数: 101

来自主题: Biology版 - RNA seq 数据统计分析问题请教

每个处理有2-4个重复，好像有人说要按 count data 来分析，但是，normalize 后，
就变成有小数点的数据了，更像芯片类型的数据，可否就用芯片数据分析方法比如SAM
来分析？另外，有重复里有0这种数据，是把它变成1，0.1 或0.001来进行 log
transformation? 先谢！

Z******5
发帖数: 435

来自主题: Biology版 - 请教怎样从GEO数据库里下载到某一类肿瘤完整的数据？

GEO有没有依据肿瘤类型对数据进行分类？比如怎样能快速、完整地下载到breast
cancer的表达谱数据？

s****y
发帖数: 585

来自主题: Computation版 - Fortran和C++的数据转换问题

都是双精度类型的数据，Fortran输出到文件
-3.2500000000000000D+05，
现在有一个C++的程序要从该文件读出这个数据，
直接读无法读出来。
请问怎么把这些数据读出来？
现在我是把一个个数字/字母当字符读进来，把D写成E；这个办法似乎土了点。
有没有更好的办法，直接能够读出来；或者读出来直接转换一下就行？
Thanks.

R*******y
发帖数: 19

来自主题: Computation版 - MATLAB作图，有没有办法既画完整曲线又不标注所有样本点？

比如一组数据x和y，用plot(x,y,'b-*')作图，则*的个数是与length(x)相等的。有没
有一种办法，让标注不要那么密集。比如x本来有1000个点，我的图是按1000个点画的
（为了显得连续），但*只显示50个，也就是每隔20个真实数据点作一个标注。
有一种方法是先画一个没有标*的，再把数据隔20点采一次样，得到一组新的采样后的
x2,y2，然后再用纯*无线图画到同一个figure上，等于覆盖在原曲线上。但是这样有一
个弊病：如果用legend显示数据类型，会出现两种不同标注，一组是有1000个点的纯曲
线图，一组是有50个点的纯*点图，相当于是两条曲线－－这一点是无法骗过legend函
数的。:P 用这个方法，除非你不标legend，否则是不可取的。
有没有其他办法，能够实现我想要的那种功能呢？（概念上应该得在一条曲线上，否则
legend这里肯定会有问题……）
谢谢高手指教！

Z******i
发帖数: 106

来自主题: EE版 - 基于内容的检索与MPEG-7（下）

基于内容的检索与MPEG-7（下）
［作者：王玉霞转贴自：《世界广播电视》点击数：179 文章录入：admin
］
基于内容检索系统的一般结构
基于内容检索(CBR)系统虽然没有统一的形式，但一般由两个子系统构成：数据库生成子
系统和数据库查询子系统。每个子系统由相应的功能模块和部件组成，如图1所示。
特征抽取
对视频、图像等多媒体数据自动或半自动地进行特征抽取，提取用户感兴趣的、适合检索
要求的特征。特征提取可以是全局性的，如整幅图像和视频镜头，也可以针对某个目标，
如图像中的子区域、视频中的运动对象等。
数据库
生成的数据库由媒体库、特征库和知识库组成。媒体库包含多媒体数据，如图像、视频、
音频、文本等。特征库包含用户输入的特征和预处理自动提取的内容特征。知识库包含领
域知识和通用知识；可以更换知识库中的知识表达方式，以适应不同领域的应用。
检索(匹配)引擎
检索是利用特征之间的距离函数来进行相似性匹配。模仿人类的认知过程，近似得到数据
库的认知排序。对于不同的媒体数据类型，具有不同的相似性测度算法。检索(匹配)引擎
中有一个较为有效、可靠的相似性测度函数

z*****2
发帖数: 498

来自主题: MedicalCareer版 - CMG医生服务的医疗机构类型的统计

CMG医生服务的医疗机构
Hospital： 31%
University： 13%
Group: 40%
Solo: 3%
从数据库中得到数据并不困难，难的是机构的确认。按照老美的话只能是用我们的”
best knowledge”. 有几点我们要说明：1，本数据取自
http://physician.cmgforum.net
, 2， PGY没有加入统计。 3，很多医生即服务于医院，也有自己的诊所，我们只能按照数据
库中的数据来统计。3，hospital 和 practice group的确认有时很困难，我们主要是根据是若
有in patient服务则认为是医院，反之为Group. 4，数字相加并非100，剩下的应该是PGY和其
他。错误是难免的，只是一个粗线条的东西。欢迎批评指正。

y****d
发帖数: 432

来自主题: Statistics版 - [分享]SPSS中文视频教程--不容错过

简单说明：
有操作演示、也有讲解，还是不错的（是MM在讲，还有背景音乐，学着也不累）
包含内容：
第一部分数据处理
第二部分描述性统计
第三部分数据分析
第四部分因素分析
第五部分回归分析
第六部分相关分析
第七部分专题讲座
详细介绍：
第一部分数据处理
数据检查
数据输入
数据整理
第二部分描述性统计
连续性变量的统计
非连续性变量的描述统计
正态性检验
第三部分数据分析
方差分析
项目分析
信态分析
第四部分因素分析
因素分析简介
因素分析原理
因素分析操作说明
因素分析实例
第五部分回归分析
回归分析相关概念
回归模型选择
回归模型应用-路径分析
回归模型诊断
第六部分相关分析
相关系数与数据类型
相关与回归
相关实例演示
相关散点图
第七部分专题讲座
正态性检验
缺失值处理
标准差与标准误
卡方检验
t检验_方差分析_回归分析的综合比较
spss制图
集中量与频数分布的形态关系
均数比较
七种常用交互式绘图
四种重要抽样分布图
随机变量和固定变量
随机数生成
统计决断的两类错误及其控制
因素负荷矩阵旋转
原始分转化为... 阅读全帖

p**z
发帖数: 65

来自主题: _Python版 - Other languages have "variables", Python has "names"

刚开始用Python不习惯，为什么传递参数的时候没有办法指定是 by reference 或者
by value。后来终于理解了，Python的变量和许多其他语言的不同，其他语言的变量名
常可以被想象成有名字的装载数据的容器，变量赋值是把数据放进容器里（即使是 by
reference，也是把指针数据放进指针变量里）；Python的变量名却最好比喻为在对象
上贴上的名字标签，所以变量赋值永远是 by reference，就是在已经有的对象上添一
个标签。这个可能跟Python所有数据类型都是对象(object)有关系。
这个方法通常最有效率，但是也容易让人迷惑，因为跟一般人的编程习惯不一样。
对于 immutable 的对象（比如浮点常数，字符串常数等等），把它赋值给一个变量名
仅仅是给这个常数对象贴上新标签，常数对象本身并不能被改变。如果两个标签 A 和
B 贴在同一个常数对象上，给 A 赋新值就好像把这个标签揭下来贴到另一个不相干的
常数对象上，对 B 没有影响，所以表现好像跟 by value 传参很像，但实际上还是 by
reference 的。
但是对于 mutable 的对... 阅读全帖

t********5
发帖数: 522

来自主题: JobHunting版 - python的list和array是一个东西？

list里面可以放任何数据类新或者原型数据你可以把变量放到list里面然后让该变量
引用任意数据类型
python的话 codecademy的教程入门就挺好入门完了写写各种数据结构常见算法和排
序基本上这两个过完了面试需要的python技巧你就都有了
之后就可以开始拿python刷cc150之类的了
小project你可以写写爬虫 django什么的

B******n
发帖数: 1

来自主题: JobHunting版 - 电话面试 - 是不是被阴了？

电话面试某Pre IPO公司某研发职位，阿三面试官，Skype+Collabedit写程序。
电面之前已经有了一轮coding interview。算法题，顺利找到O(N)算法，过关。
第一次Skype电话面试，不了解行情，以为Skype就是打电话而已，所以在车库里面准备
面试，车库里面比较安静，没有闺女捣乱。结果阿三非要我开摄像头。我只好开开摄像
头给他看我凌乱的车库。
寒暄不说了。先Go Thru简历 5分钟不说了
第一题一个单向链表，移除一个node。这种题目还用做么？讨论了下如果删除最后一个
节点怎么办，然后用了两分钟左右写完code，面试官看了半天没有发现bug
有一个数据库若干表写SQL，一分钟左右写完，时间大部分都用在敲字上面了，都没有
考虑什么，他没有发现问题。
然后是程序改错题。总的来说是一段代码，对多线程的情况完全么有考虑。需要在诸多
地方加上控制。但是因为他的业务逻辑很简单，所以其实有些地方synchronize加不加
其实是一样的。我就给了一个只在需要加锁的地方加锁的解法。然后他不happy了，说
你为啥只锁变量1，不锁变量2捏？我说因为变量2锁了不锁都一样啊，... 阅读全帖

s*********l
发帖数: 28

来自主题: JobHunting版 - 求版上大神指点电话面试【也算面经吧】

长帖预告... 冷门专业一职难求，找了几个月终于有一个相关的职位，联系了内推然后
拿到了电话面试，面完心里很惶恐，求大神指点，拍砖提建议...
这是一个analyst职位，大致是做天气、气候、土壤水、卫星遥感方面的数据分析，需
要的技能比较杂，从气象、到气候、到农业、到统计、到GIS、到编程和脚本、再到交
流和写作能力，全都要。我大概符合80%吧，有个编程语言我不会，口语和本土美国人
比还是欠一些的。
这个职位是我们系四年前毕业的一个学姐升职而空出来的，我联系了她一下，搭了个讪
表了个忠心，附上了resume和cover letter，然后她说我的resume和letter都写得很好
，我简历上的skills也符合他们大部分要求，就帮我跟负责招人的两个manager说了一
下，于是一周后就拿到了电话面试。准备期间先后问了学姐很多东西，她的回答很热心
很详细，我觉得自己估计没有惹人讨厌。
电面是组里的两个research manager做的，接通后就立即开始介绍这个职位，blabla一
通之后就让我说说自己之前每个proj的详情。我就把每个proj按照“做什么的、用什么
数据、想得到什么... 阅读全帖

s*****r
发帖数: 43070

来自主题: JobHunting版 - 12306最基本的一个问题，用什么数据結構存票？

俺觉得这个数据库里没有票的概念，只有车次编号，座位编号和区间编号，车次，座位
类型和区间决定车票价格
顾客买到手的是张车票，上面的全面信息代表数据库里面的一个订单，就是所谓的车票

E**********e
发帖数: 1736

来自主题: JobHunting版 - 今天写了个比较effecient XML parser

还不懂xpath。
现在是从xml转化到python dict。 namespace有相应的函数处理掉。
这个parser是用来处理工作的数据。目前没有必要考虑iso是么。也许处理别的vendor
的xml还会有bug。不过即使有debug，再改进也行。核心的东西就是recursion。而且
也有附属的数据转化功能， xml 相应的text 转化成相应的数据类型。
总的来说，处理experian的信用报告的xml 也就足够了。

e*e
发帖数: 6808

来自主题: Running版 - 对比我的两组心跳数据

小龙啊，我觉得你不用那么纠结HR。不同的人可能适合不同的训练方法和指标。有些数
据，收集了可以做参考。make sense的好好分析，不对劲的，不用那么纠结。
回whxhm1，MHR，跟人有关，跟擅长的速度可能没关系。小龙以前是跑5000的，我认为
这也算中长跑吧。我朋友短距离很差很差的，坚持长跑，pace不到9分跑9迈的HR是190+
，也是一跑HR就居高的类型。
前两天开会，早上跟同事long run。一个HR超低（女，22岁测MHR就只有170多），她说
她喜欢跑hills是因为那是唯一她能感到心跳的时候。另一个，女，26岁，BQ了，NYCMQ
了，年年跑oregon的H2C （orz orz orz），她说她从来不care HR，完全不知道数据。
所以，小龙，我觉得你数据照收，但不用那么纠结。

z*********n
发帖数: 94654

来自主题: Joke版 - 算了，我还搞点学术普及把

不过这几年大数据也罢好多网站的新技术也罢，都有一个很大的特点，不太在乎确定性
和准确性
都是best effort，关键要赶紧出结果，快，万一出个错，大不了user界面弹出个窗口
，点一下重试不就完了
所谓用大数据推荐的广告也尽是已经买了的东西，还要追踪你一万年
就是这些不需要100%精确，让好多open source不是很可靠的tool大行其道，让好多所
谓大数据类型的计算门槛严重降低，呵呵

c******n
发帖数: 16666

来自主题: Joke版 - 知乎看到的裸条大数据

作者：阿亮同学
链接：https://www.zhihu.com/question/47736379/answer/133681007
来源：知乎
著作权归作者所有，转载请联系作者获得授权。
可耻地答一下，真的辣眼睛啊
然后职业病做一波小分析，稍微统计了一下数据
1.学校按照类型分类，分布数量的多少依次为：
专科>中专高职技校>二三本>艺术院校
可以看出学历越高等，素质越高，生活水平越高的趋势在统计上的确是存在的，但985
，211也存在部分脑袋拎不清楚。其中竟然还有自称是北影之流戏剧学院的，神他妈脑
子有坑，北影的你这么来借钱？系唔系Excited? 知乎政治正确上多次老生常谈的“知
识改变命运，学历越高生活越好”又一次得到了验证。当然，也可能由于该样本群体的
特殊性，无法下因果性结论，只能说存在相关性。
2.户籍分布：
行政等级上，乡镇县>地级市>农村户>大城市
地区上，中西部>东部
基本上偏僻较为落后地区的姑娘以压倒性优势碾压了富足地区，其中未出现一线城市城
镇户口，省会城市城镇户口的样本。虚荣的物欲果然还是会让人迷失理智的，广大姑娘
们要提高自身知识水平，内心富足才是真的富足，... 阅读全帖

z*******3
发帖数: 13709

来自主题: Java版 - 说说spring和ejb的差别

抛砖引玉
吃饱了看文茜世界财经周报，看得昏昏的想睡，睡觉前赶紧写，写完睡觉去了
这样，先不从dto说起了，说tiers
一个j2ee经典的tiers最早提出来的时候，是三层，所谓的三层说的是sever side三层
不包括client side和database
三层里面分别有一层专门跟以上两个东西打交道
一个是presentation tier，这个跟client side打交道
一个是persistent tier，这个专门跟database打交道
中间还剩下一个叫做business tier，这么三层，这都很熟悉了
那么当初提出这个构想的时候
是基于以下一个方式
client side是applet＋browser
presentation tier是servlet+jsp，servlet是controller，jsp是viewer
model需要你自己去提取，去包装
business tier则是ejb，尤其是session bean，stateful和stateless
persistent tier也是ejb，是entity bean
database用jdbc连接
这五个... 阅读全帖

S*A
发帖数: 7142

来自主题: Linux版 - Google go 还挺不错的

最近学习了一下 google go. 觉得还挺好的。我大胆预测以后一定会火。
整体感觉，填补了 C 和 Python 中间的空白。
和 C 一样，直接生成机器代码这个非常好。这一点就把什么 Java, C#
都比下去了。估计以后成熟写应该能和 C++ 的速度差不多。我一直想找
个类似 C 的但是可以直接用 dictionary & array 的抽象数据类型的
语言。以前我学过的最接近的是 Objective C, Objective C 其实挺不错
的，就是写起来比较长一点。最大的问题是出了 OSX 没有地方可以用。
Python, Lua， Java 子类都太慢，什么都是 Box Type. 没法快起来。
这个 C++ template 那一套太复杂，而且生成很多不必要的代码（各种
basic type 生成一套）而且 OO 多重继承那一套就是走火如魔了。
最近在玩一些 Graph 有 8M 结点, 200M 条边. Python 最最优化的程序装
进来也要几分钟。我已经恨不得给 Python 手写 C module 来装如那些数据了。
Python 有个地方很讨厌，slice ... 阅读全帖

N******K
发帖数: 10202

来自主题: Programming版 - 请问：如何设计一个复杂数据类的存储文件格式

我有一个数据类里面很多成员
成员1 是一个矩阵
成员2 是一个图
成员3~10 是一些数字
我现在是这样保存这个类
dataobject.json 存储这个类的大致信息
有多少个成员啊
每一个是啥类型
每一个成员的简要信息：比如矩阵是 10x10的 double精度
dataobject.member1.data 存贮矩阵二进制方式
dataobject.member2.data 存贮图二进制方式
dataobject.member3to10.data 存贮 name-value pair 文本方式
这样这个类对应很多数据文件
如果更加复杂就得变成了dataobject.memberX.memeberY.memeberZ.data
请问还有其他什么办法？

R***r
发帖数: 49

来自主题: Unix版 - 请教几个问题！！

1。用什么命令可以读取大文件某段数据？文件数据类型是floating
point。比如读图像raw文件从第100个byte到第200个byte？
2。在C－shell里调用gawk，能保存变量吗？不如gawk读出一个数据，
能保存成一个变量 a，然后在下一行语句里用这个变量吗？

c****l
发帖数: 53

来自主题: Biology版 - 招人 (big data 相关)

老板最近成立一个center (Center for Statistical Inference in Biomedical Data
Science), 有很多钱, 想招一些人. 老板是UPenn Biostatistics的 Full Professor
http://statgene.med.upenn.edu/, 新成立的center主要做跟Big data相关的东西, 比如genomic data, image data, EMR/EHR data, social network data . 老板人很好, 职位都是学校里面职位, 身份问题比较好解决, 薪水应该都是UPenn的薪水标准.
目前有如下几个职位:
1. Programmer: 硕士就可以了, 因为实验室主要做一些统计方法, 所以需要招人把统
计方法做成可以用的软件, 供其他人使用, 所以主要工作就是编程. 我们主要用Python
和R, 偶尔用一些C++和JAVA. 这个职位是长期职位 (permanent position).
2. Scientist: 要求有博士学位, 我们实验室和医院(主要是CHOP... 阅读全帖

c******5
发帖数: 22

来自主题: Statistics版 - large dataset impot into SAS

columns.
的确是有mixed的数据。可是我转了个相似的data没问题啊。详细说说吧：
1. 我在access里要用到它的3个tables中的信息。首先，我一个table一个table的把它
们变成了excel file，然后用proc import一个一个的把它们转到SAS中。成功。
2. 因为我想把3个tables中的信息放在一个table中在SAS中做Analysis，但SAS中用
merge什么我怕有multiple entries （不同的table有不同数量的multiple entries）
容易出错。所以我在access里用query把这三个tables先放到一起，然后转成一个excel
sheet，最后录入SAS。于是就给出了error message。
所以我觉得mixed的数据类型应该不是问题，因为之前没有出错啊。我能想到的就是
combine了以后row 太多，但前面也有朋友说SAS能handle很大的数据，应该也不是问题
。还有就是SAS能发现我这个新的excelsheet是从access中combine了不同的tables来的
所以有问题？觉得这... 阅读全帖

D*********2
发帖数: 535

来自主题: Statistics版 - 弱问大数据处理

最近接一新project，40+ million line，大概70个左右variable，数据给的是.csv格
式。问题是cookbook做的很差，很多unexpected value，比如一variable cookbook上
写是0－9 coding，结果什么负数啊，感叹号啊，有时missing value还用date表示。非
常不能理喻。
所以第一个task就是逐一审阅unexpected values，补全cookbook
这个大小的数据用R没戏，用SAS在不知道这列到底改是啥数据类型的时候要反复调很多
次，而且读进去有时候也匪夷所思的，出现些更离奇的符号，*啊，~啊。现在解决的办
法就是分段读进R（大概10 million一段），然后做summary，然后人工总结，说实话满
累的。
而且这也不是个办法，之后merge阿什么的应该还是要SAS SQL，感觉还是要一次性全搞
进SAS才是正道。我SAS很差，Python之类之略知皮毛，求这种情况SAS应该怎么倒，或
better solution。
谢谢谢谢。

o****o
发帖数: 8077

来自主题: Statistics版 - 再请教一个numpy的问题

我用genfromtxt读入一个csv文件，混合型数据类型
这个时候得到的数据其实是一个array of array，比如这种
x = array([ ('abc', 1, 2, 3),('cde', 0, 1, 3), ('ede', 4, 5, 6)]
要拿到每一个位置的具体数据就要这么index：x[1][0]，但是又不能用wild card :
这种情况你们是怎么处理的？
当然我可以自己写一个customized的读入模块，这不是希望多借用已有资源么。

c****l
发帖数: 53

来自主题: Statistics版 - 招人 (big data 相关)

F*V
发帖数: 3978

来自主题: ChinaNews2版 - 新闻联播明年将延续《你幸福吗》类型调查

新闻联播明年将延续《你幸福吗》类型调查
2012年11月12日02:37 北京晨报评论(4人参与)
一年一度的中央电视台黄金资源广告招标大会将于11月18日在京举行。近日，央视
广告中心主任何海明接受了记者采访，提前透露2013年央视新的节目安排和变化。据了
解，《新闻联播》将延续《你幸福吗？》这一类调查，并且增加《寻人启事》这样的板
块。
视频：央视记者街头采访你幸福么路人答我姓曾来源：CCTV新闻频道
综合频道变化巨大
2013年，央视继续进行更大力度的节目调整，推出许多新节目，其中，CCTV-1的变
化非常大。比如，《新闻联播》、《朝闻天下》、《晚间新闻》等新闻栏目将联动进行
改进。2013年《新闻联播》还将延续《你幸福吗？》这类主题策划，增加《寻人启事》
这一亲民性板块，接上地气，做足影响。另外，央视将重点打造23时30分主持人精品节
目带：包括：《小撒时间——证据在说话》、《王刚时间——收藏传奇》、《张斌时间
——传奇体育》、《岩松时间——观天下》、《柴静时间——看见》、《崔永元时间—
—小崔说事》，节目均自2013年1月1日正式播出。
公益节目方面，2013年，《寻找“... 阅读全帖

b*****d
发帖数: 61690

来自主题: Military版 - 新闻联播明年将延续《你幸福吗》类型调查

发帖数: 1

来自主题: Military版 - 推娃推成功的就一种类型：娃自己乐意

第一，清华人最喜欢问英雄出处，这事儿你不知道？
哈尔滨有个哈三，河北有个石家庄2中，湖北有个黄冈，北京有个四中人大附，辽宁有
个实验，这些都是清华每年录取的兵家之弟，也是清华人津津乐道的出身必备话题，你
这是没在清华读的本科吧，
你不知道有些同学都把高中母校名字都挂在PhD的CV上吗？
第二，你表哥的case在你人生中有多少人是这样的？是就这一个，还是100来个？我
有必要把这么0.0001%的case放进去算成类型吗？
我先说我的，我就知道我表弟那一个case，而且还是我高度质疑我姑妈评价的真实性的。
事实数据根本就是约等于0.
姐今天脾气大，感觉你说话不太着边儿，所以出言不逊，请多包涵。

b***m
发帖数: 5987

来自主题: JobHunting版 - 新鲜A家电面……请问设计题怎么算回答得好？

的？
真不是谦虚，离大牛还差得远。我的特点跟印度人有些像，比较能侃，但是科班基础不
够牢。
我们可以列出这个system需要的信息：酒店的数量（连锁？），酒店的地址（或者编号
），是否有会员以及级别，reservation的来源（网络？电话？），房间数，房间类型
（Queen？King？Suite？），客人数（以及姓名等资料），每个房间停留的天数，是否
有特别要求（晚来？早走？宠物？婴儿床？朝向？残疾人方便？抽烟？），付款方式（
现金？信用卡？积分？）……这些信息列出来基本就差不多了。
在这些信息基础上，抽象出数据类型和数据库表的定义（包括索引字段等等），然后大
概可以归纳出如下容器（class）：Hotel，Client，Room，Membership……他们之间大
部分是包含的关系，然后在定义出各个interface：Reserve，Extend，Payment，
Modify……
大概就是这么个意思吧。瞎写一通，见笑了。

a********m
发帖数: 15480

来自主题: JobHunting版 - G家杯具

有可能差很远，但是你这个说的还是太简单了，报告还是非常细致的。
举个例子吧，比如一个简单的coding题目,写程序做稍微变化一点的bfs。报告里面一般
会包括这些信息中的一些（如果值得记录的话，正常的话不一定记）：
-理解题目是不是很顺利，
-问问题确认数据类型还是直接用整数，
-花多少时间明白是dfs，
-花多少时间确定使用的方法，
-解释方法是不是思路清楚，交流能力有没有问题，
-是不是故意多说其他的东西来隐藏自己不清楚概念或者方法，
-是很确定还是犹豫，
-写代码是很流利还是断断续续,
-写到某个步骤停下来思考和改动，
-写代码是不是熟练，
-有没有可能最近写过这个代码，
-代码思路是不是清楚，
-bug是什么类型，是否合理，
-bug是自己看出来还是需要指出，
-修改bug花多少时间，
-怎么找到，理解和修改bug
-解释bug和解决方法是不是清晰流利，
-修改是正确的修改还是只是修补让结果正确。
-时间空间复杂度，
-用多长时间思考，
-有没有解释，思路是不是清楚，
最后，把你的代码记录在报告里给hc看。
总之，一个函数写对了不代表什么。

z*********n
发帖数: 1451

来自主题: JobHunting版 - 来讨教个面试题

我是不是提前先问你这是啥数据类型了？
是不是说了不同类型手法不一样。
然后你告诉我是int
我码了七行字解了后你啥别的不说只回仨字“double咋整”？
自己琢磨吧。

w******t
发帖数: 241

来自主题: CS版 - 请教一个问题：如何在fedora下面看自己的wirelesscard的类型 (转载)

【以下文字转载自 Linux 讨论区】
发信人: webcraft (此处不留爷，自有留爷处；处处不留爷，爷, 信区: Linux
标题: 请教一个问题：如何在fedora下面看自己的wirelesscard的类型
发信站: BBS 未名空间站 (Thu Jul 17 11:51:10 2008)
正在做一个项目，应该需要了解WLAN card的型号。另外我还有一个类似的问题，在
iwconfig下我看到我的wireless interface是ath0.但是在ifconfig下似乎又是wifi0.
我现在想用tcpdump检测wireless端口的数据。不知道应该检测哪个interface？谢谢
大家

t********k
发帖数: 808

来自主题: Database版 - Java调用Oracle存储过程的问题

存储过程有一个数组参数
类型是 Table of Varchar2(20)
在Java调用该存储过程时
要用什么数据类型传进来呢?
String [] 不行啊,如
Strign [] strArray = {"12","34","56"};
cs.setObject(1,strArray,java.sql.Types.ARRAY);
这样会抛出异常
那怎么传呢?
谁做过呢?
谢谢

e*********y
发帖数: 29

来自主题: Database版 - 转换成时间的格式 MS SQL

你能保证你处理的包含所有数据类型吗？
这个取决于你的table field是哪种类型吧.
substring (STUFF (datafield,1,0,'0'),1,2)+'/'+substring (STUFF (datafield,1,
0,'0'),3,2)+'/'+substring (STUFF (datafield,1,0,'0'),5,2)

t********k
发帖数: 808

来自主题: Java版 - Java调用Oracle存储过程的问题

t********k
发帖数: 808

来自主题: Java版 - Java调用Oracle存储过程的问题

我也是这么认为的
想用java.sql.Array数据类型试试
但怎么把String[]转换成java.sql.Array类型呢?
查了查API
好象没有互转的方法啊

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

topics

未名新帖统计// 7月16日

历史上的今天