由买买提看人间百态

topics

全部话题 - 话题: 数据压缩
1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)
a*****e
发帖数: 92
1
【 以下文字转载自 Programming 讨论区 】
发信人: aaapple (青青子衿), 信区: Programming
标 题: 请教:.NET Framework 1.1有没有支持数据压缩的函数?
发信站: BBS 未名空间站 (Mon Aug 7 23:28:18 2006)
现在一个project,需要进行数据压缩。我知道2.0里边有System.IO.Compression
惺菅顾酢G胛剩現ramework 1.1 里边有没有方便的实现数据压缩的方法?谢谢指教
a*****e
发帖数: 92
2
【 以下文字转载自 Programming 讨论区 】
发信人: aaapple (青青子衿), 信区: Programming
标 题: 请教:.NET Framework 1.1有没有支持数据压缩的函数?
发信站: BBS 未名空间站 (Mon Aug 7 23:28:18 2006)
现在一个project,需要进行数据压缩。我知道2.0里边有System.IO.Compression
惺菅顾酢G胛剩現ramework 1.1 里边有没有方便的实现数据压缩的方法?谢谢指教
h*****u
发帖数: 14
3
来自主题: Chicago版 - 征数据压缩/解压缩算法专家
如果你对数据压缩编程比较熟悉,请与我联系,我有个项目请你帮忙,费用我们一起商
量。
[email protected]/* */
h*****u
发帖数: 14
4
来自主题: Computation版 - 征数据压缩/解压缩算法专家
如果你对数据压缩编程比较熟悉,请与我联系,我有个项目请你帮忙,费用我们一起商
量。
[email protected]/* */
h*****u
发帖数: 14
5
来自主题: Mathematics版 - 征数据压缩/解压缩算法专家
如果你对数据压缩编程比较熟悉,请与我联系,我有个项目请你帮忙,费用我们一起商
量。
[email protected]/* */
r****y
发帖数: 26819
6
zlib 总找得到把。
http://www.icsharpcode.net/OpenSource/SharpZipLib/Default.aspx

惺菅顾酢G胛剩現ramework 1.1 里边有没有方便的实现数据压缩的方法?谢谢指教
e*******r
发帖数: 4
7
如题。
要submit一个很大的循环,每一步都export很大的数据,只有压缩后才能在server上暂
时保存好留出足够多的时间将数据转移。谢谢大家。
R******e
发帖数: 623
8
来自主题: Programming版 - 从数据压缩角度理解CNN
呵呵。记住了,科学是压缩数据的艺术。
L****8
发帖数: 3938
9
来自主题: Programming版 - 从数据压缩角度理解CNN
CNN的各种模板 从输入层开始
可以认为是 fixed length code data compression
连接好几层 就可以达到 压缩 再 压缩的效果
最后一层几个数的特征向量 就可以描述输入图片
如果用 variable length encoding 是不是 只需要很少几层 就可以完成特征提取?
比如说 zip文件 压了再压 基本没用
一个简单实现 就是 每一层 用不同大小的模板
另外 resnet 就是对应于差分编码方法 这样可以达到对细节的信息 不会丢失太多
m*****e
发帖数: 47
10
来自主题: Programming版 - 从数据压缩角度理解CNN
好主意,顶一个。
我考虑过类似的问题,有几个不同的角度。
一,神经网络本身就是提取信息,是一种压缩,一堆猫狗图片,最后就是一个bit,是
猫还是不是猫。
二,神经网络本身的压缩,有些地方计算精度可以降低,并不影响结果,最近好像有人
发了文章,是关于这个的。你的想法似乎是这个角度。
三,针对具体问题,到底需要多少神经元,再多就是浪费,少了影响结果。或者说,你
做了个网络,结果不错,你怎么知道是minimal。
b*****d
发帖数: 61690
11
部分省份在政府工作报告中公布了2013年三公经费数据
削减三公经费 各地答卷是否合格
本报记者 李松涛
最近一段时间,各地相继召开地方两会,三公经费削减情况成为社会关注的焦点。
2012年12月4日,中共中央政治局召开会议,会议一致同意关于改进工作作风、密
切联系群众的八项规定。从这一天起,勤俭节约成为政务活动的基本要求。
如今,距离八项规定的出台已经近14个月,各地都交出了怎样的答卷?
20个省(区、市)拿出数据,会议削减最高达50%
按照八项规定的要求,各级政府要精简会议活动,精简文件简报,规范出访活动,
严格执行住房、车辆配备等有关工作和生活待遇的规定。
八项规定出台后,各地政府都开始从公务接待、公务会议等支出上下功夫。正是从
2012年底开始,之前一直火爆的高档餐饮冷了下来,花卉租售市场冷了下来,高端礼品
市场也冷了下来。
在我国,公务接待费用、公车购置及运行费用、公务人员因公出国(境)费用被称为
三公经费。
中国青年报记者对全国多个省市发布的政府工作报告进行了查阅,结果发现,有些
省市给出了削减三公经费的数据,有些省市尚未公开相关信息。
截至记者发稿时,全国31个省(区、市)... 阅读全帖
S*********4
发帖数: 5125
12
来自主题: Military版 - 登月造假之实况转播真相的揭露
(一)引 言
正当ACT网络论坛争论美国阿波罗登月真伪吵得不可开交,反对哈姆雷特的声势四
起之时,哈姆雷特贴出了一份出乎人们意料的回帖, 他提出:“阿姆斯特朗说"鹰
已着陆"时,是在地面录音棚里说的”。
并声称他找到了“最最确凿的证据”。他
说:
前一段我还在研究登月照片,对其中种种造假的珠丝马迹提出疑问,还有
对其工程技术方面提出疑问。现在,我可以抛弃所有这些证据不谈了,我可以
抛弃所有这些技术细节不谈了。
因为我已经找到了最最确凿的证据,可以毫不犹豫地,不容丝毫怀疑地确
证,阿波罗登月是美国宇航局导演的一出空前绝后的一场好戏。美国根本没有
上过月亮。阿姆斯特郎说“鹰已着陆”时,是在地面录音棚里说的。
我不想把我这个铁的证据说穿,留着还有用呢。再说我一但说破了,明天
联邦调查局就该来找我了。我还准备留着写书呢。再说,我一但说破了,所有
持怀疑态度者不就马上接受我的结论了吗?那太便宜了。中文牛矢铺里好不容
易有了一样大家都感兴趣的话题,可以各舒己见进行辩论,不能轻易把结果说
出来嘛!
(哈姆雷特,Re:阿波罗登月是大骗局,ACT19971206)
很遗憾的是哈姆雷特的这个回帖没有把“这... 阅读全帖
n*****e
发帖数: 40
13
来自主题: Internet版 - ISDN术语解释
ISDN术语解释
B通道:ISDN的支持通道,提供64kbps带宽来传送语音或数据资料。
D通道:ISDN的控制信号通道,在ISDN网络端与用户端之间传输旁带
信号,此通道也可用于传输X.25 资料,但交换机要能提供此项服务。
基本速率接口(BRI):一个定义ISDN界面的标准,一般包括一个D通
道及两个B通道,一般称为2B+D。
基群速率接口(PRI):一个定义ISDN界面的标准,一般包括一个D通
道及三十个B通道,一般称为30B+D。
V.42bis压缩协议:是使用高效率的数据压缩演算法,将数据压缩的效
能比率提升到最高的4:1。
V.42错误控制协议:V.42协议提供数据在传输过程中,确保数据的准
确性。
Stac 压缩协议:一种数据压缩协议确保高速PPP连接。
多链路PPP(MLPPP):绑定两个ISDN 64kbps B信道,提供一个128kps
的连接通道。
按需分配带宽(BOD):即Bandwidth-On-Demand,也就是可以根据网
络需求自动增加或断开一个B信道。 他能自动侦测网络带宽的利用情况,
当用户在阅读下载的HOMEPAGE,或进行少量数据交换时,自动断开
t******t
发帖数: 15246
14
http://blog.sina.com.cn/s/blog_5004d5cb01007zzh.html
作者:常山 提交日期:2006-8-19 23:54:00
月球探险者通讯系统使用所谓的S波段与地球通讯联络,通讯地面站使用所谓的深
层空间网,由一个七十米天线阵组成,所谓的S波段频率约两千多兆,信道容量能力最
高仅为每秒三千六百比特。这么低的信道通讯能力,大大出乎我的预料。于是我作了一
番计算,估算在理想状况之下,从热力学原理出发,理论上可以达到的最高通讯信道容
量是多少。稍懂点普通物理的朋友都知道,信息即是负熵,中间只差了一个波尔之曼常
数,而熵乘以温度即是能量。信息的传播,必须通过传送最低需要的能量来达成,温度
越低,携带同等信息所需能量越少。这就是为什么许多高灵敏度的物理实验都必须在超
低温下做,许多的高灵敏接收天线都要降到超低温来提高灵敏度。天线阵是不可能泡入
液氮里的,所以我们用常温来进行计算,为了方便,假设环境温度是绝对300度,乘以
波儿之慢常数,得出要传送一个波特信息所需要的最低能量为百万分之四皮焦耳... 阅读全帖
n****l
发帖数: 3375
15
首先要承认标题只是个噱头,语言学一般认为语言没有先进落后之分。大家都有自己的
看法,见仁见智吧。但是总看到有人在争论到底汉语是先进还是落后。虽然我不 是专
业人士,但是就用点通讯和存储上的概念来聊聊为什么汉语是一种非常先进的语言。需
要注意的是,虽然以下的论证都是基于实际的实验数据,但是计算都很粗 糙,而且实
验的规模都不大。换句话说就是,虽然在这里汉语占优,但是换一批实验参与者,可能
就倒过来了。现在实在没有什么特别全面的测试。所以下面的数字 大家看看就行,不
必太过认真。世界主要语言的效率其实都已经达到当前人脑的一个瓶颈了,总体看差异
不大。我的目的也主要是打击一下逆向民族主义者。
一、语言水平高低的评判准则
口语,放在今天来分析,实际上是一种通讯协议。就是说,语言实际上是把人的思想通
过发音器官变成一串频率不同、波形不同的声波,然后有另一个个体的听觉器官和相关
的脑部组织重新转变回思想。通讯协议,就是一个规则,一个规定了应该如何把思想/
信息转变为易于传输的信号的规则。计算机上,通讯协议基本上有这么两个评判标准:
传输效率和抗噪能力。所谓传输效率,是说,在单位时间里,按照该通讯协... 阅读全帖
g***j
发帖数: 40861
16
【 以下文字转载自 Military 讨论区 】
发信人: ntkrnl (ntkrnl), 信区: Military
标 题: 为什么汉语是世界上最先进的语言之一
发信站: BBS 未名空间站 (Tue Feb 3 10:19:07 2015, 美东)
首先要承认标题只是个噱头,语言学一般认为语言没有先进落后之分。大家都有自己的
看法,见仁见智吧。但是总看到有人在争论到底汉语是先进还是落后。虽然我不 是专
业人士,但是就用点通讯和存储上的概念来聊聊为什么汉语是一种非常先进的语言。需
要注意的是,虽然以下的论证都是基于实际的实验数据,但是计算都很粗 糙,而且实
验的规模都不大。换句话说就是,虽然在这里汉语占优,但是换一批实验参与者,可能
就倒过来了。现在实在没有什么特别全面的测试。所以下面的数字 大家看看就行,不
必太过认真。世界主要语言的效率其实都已经达到当前人脑的一个瓶颈了,总体看差异
不大。我的目的也主要是打击一下逆向民族主义者。
一、语言水平高低的评判准则
口语,放在今天来分析,实际上是一种通讯协议。就是说,语言实际上是把人的思想通
过发音器官变成一串频率不同、波形不同的声... 阅读全帖
p****e
发帖数: 468
17
德国选出本年度菲利普·莫里斯研究奖得主

所有跟贴·加跟贴·论坛主页
送交者: 新华社 于 January 19, 2000 15:16:57:
德国选出本年度菲利普·莫里斯研究奖得主
新华社柏林1月16日电(记者刘钢)德国菲利普·莫里斯
基金会15日晚宣布,2000年度菲利普·莫里斯研究奖将分
别授予数据压缩技术、连续激光、可控化学反应和猴子行为研究
四个课题组。
慕尼黑工程师彼得·艾克领导的数据压缩技术小组,在数据
压缩领域获得突破。数据经新技术压缩后,大小减至用普通技术
压缩后的五分之一。这个研究小组现已成立公司,准备将此项技
术推向市场。新技术将能够极大地提高数据传输速度。
德国马普兰研究所的量子光学物理学家汉斯设计出一种新型
激光器。利用这项技术,科学家可以在零下273摄氏度的环境
下,拆除物质表面的
z**r
发帖数: 17771
18
来自主题: EmergingNetworking版 - 如何通过internet快速传输大数据文件
如果你不停地传输,那么你需要至少30G*8/24/3600=2.8Mbps 带宽,但一般来说,总是
有burst的,所以实际带宽需求比这个要大,取决于你的traffic pattern。
如果你的数据估计能被压缩,那么像saiwong说得,搞两个能做压缩/解压缩的box比较
划算,如果数据都是图像,视频之类的,因为本身已经被压缩过了,再压缩可能也没有
任何意义了。还是从带宽入手是根本。
z**********e
发帖数: 22064
19
扫煤才子 于 2008-4-16 23:36:12 发布在 凯迪社区 > 猫眼看人
伪造数据和伪造历史的张宏志──《“大跃进饿死三千万人”纯属捏造》分析

看到这篇文章很久,实际上,在网络上一搜,轻易就能搜到不少的网页。对于这篇
文章,对“三年饥荒”感兴趣的朋友不会陌生,但是这篇文章,除了各种谎言和假设外
,并没有什么实质意义,但是,却是广大毛卫兵同志最喜欢引用的文章。这里,在下对
文章做个简单的分析,并且指出张宏志同志可笑但全无用处的伪造数据和若干制造假象
,隐瞒真相的地方,以雪亮你们的双眼。
在分析的开始,我先给大家看一张表:
│   │年末总数人口 │ 出生率 │  死亡率   │自然增长率   │
│年份 │  (万人) │ (‰) │  (‰)   │  (‰)   │
│1957 │ 64,653  │ 34·03  │  10·80    │ 23·23    │
│1958 │ 65,994  │ 29·22  │  11·98    │ 17·24    │
│1959 │ 67,207  │ 24·78  │  14·59    │ 10·19    │
│1... 阅读全帖
z**********e
发帖数: 22064
20
【 以下文字转载自 Military 讨论区 】
发信人: zhonghangyue (中行说), 信区: Military
标 题: [原创]伪造数据和伪造历史的李宏志
发信站: BBS 未名空间站 (Sun Jun 5 18:06:34 2016, 美东)
扫煤才子 于 2008-4-16 23:36:12 发布在 凯迪社区 > 猫眼看人
伪造数据和伪造历史的张宏志──《“大跃进饿死三千万人”纯属捏造》分析

看到这篇文章很久,实际上,在网络上一搜,轻易就能搜到不少的网页。对于这篇
文章,对“三年饥荒”感兴趣的朋友不会陌生,但是这篇文章,除了各种谎言和假设外
,并没有什么实质意义,但是,却是广大毛卫兵同志最喜欢引用的文章。这里,在下对
文章做个简单的分析,并且指出张宏志同志可笑但全无用处的伪造数据和若干制造假象
,隐瞒真相的地方,以雪亮你们的双眼。
在分析的开始,我先给大家看一张表:
│   │年末总数人口 │ 出生率 │  死亡率   │自然增长率   │
│年份 │  (万人) │ (‰) │  (‰)   │  (‰)   │
│1957 │ 64,653  │ 3... 阅读全帖
l********l
发帖数: 9452
21
SandForce固态硬盘主控制器非常流行,但是在TRIM方面远比其它方案复杂。一般主控
都是直接向NAND闪存写入数据,接到TIRM指令就简单地清除无效数据、恢复性能,但是
SandForce使用了一个实时数据压缩、去重引擎(动辄550MB/s的读写速度就是这么来的)
,TRIM的时候必须检查数据是否被占用,否则可能会把系统关键文件给清理掉。
一系列测试证明,SandForce主控在TRIM的时候碰到不可压缩数据(比如一部高清电影)
就会栽跟头,从来都不能恢复初始性能。Intel SSD 520系列使用独有的固件进行了优
化,依然未能根除这一问题,因此根源可能出现在SandForce主控的硬件设计层面上,
不可能通过固件解决。
更要命的是,SandForce TRIM在可压缩数据(比如大量文本文件)上也出问题了。
SandForce 3.x系列固件没什么问题,但是新的5.0.0/1/2版本中(固态硬盘厂商自己的
版本号会不一样),TRIM之后读取性能也恢复不上来。幸运的是,SandForce已经发现问
题并在测试新版5.0.3,一定程度上算是解决了,不过也付出了代价。
b*****d
发帖数: 61690
22
律师向多部门申请公开三公数据 遭发改委等拒绝
http://www.sina.com.cn 2011年07月08日02:12 新京报
根据2008年5月施行的政府信息公开条例,行政机关不依法履行政府信息公开义务
的,由监察机关、上一级行政机关责令改正;情节严重的,处分主管人员和其他直接责
任人;构成犯罪的,追究刑责。
本报讯 (记者蒋彦鑫) 国务院常务会议为中央各部门公开“三公”消费数据设定时
间表后,北京律师李劲松向多个部门发出信息公开申请,要求公布此数据。截至目前,
李劲松共收到13个部门回复。其中,国家发改委等3部门认为该数据不属于公开范畴,
国家粮食局表达了谢意后称将尽快回复,8个部门称马上公开。
律师向多部门申请公开三公数据
今年3月以来,国务院多次召开会议要求,中央部门尽快公布“三公”支出。
5月初,律师李劲松向多个部门提交申请,要求公布“三公”数据。据其介绍,要
求公布的数据共有26项,包括相关中央单位公车型号、车牌号、越野车数量、车辆运营
费用等;出国支出;公务接待费用等。
截至昨日,包括中国人民银行、工信部、国家发改委等13个部门已回复李劲松。
三部门回复称三公不... 阅读全帖
D*V
发帖数: 3096
23
发信人: brihand (brihand), 信区: Military
标 题: 律师向多部门申请公开三公数据 遭发改委等拒绝
发信站: BBS 未名空间站 (Thu Jul 7 15:51:01 2011, 美东)
律师向多部门申请公开三公数据 遭发改委等拒绝
http://www.sina.com.cn
根据2008年5月施行的政府信息公开条例,行政机关不依法履行政府信息公开义务
的,由监察机关、上一级行政机关责令改正;情节严重的,处分主管人员和其他直接责
任人;构成犯罪的,追究刑责。
本报讯 (记者蒋彦鑫) 国务院常务会议为中央各部门公开“三公”消费数据设定时
间表后,北京律师李劲松向多个部门发出信息公开申请,要求公布此数据。截至目前,
李劲松共收到13个部门回复。其中,国家发改委等3部门认为该数据不属于公开范畴,
国家粮食局表达了谢意后称将尽快回复,8个部门称马上公开。
律师向多部门申请公开三公数据
今年3月以来,国务院多次召开会议要求,中央部门尽快公布“三公”支出。
5月初,律师李劲松向多个部门提交申请,要求公布“三公”数据。据其介绍,要
求公布的数据共有26项,包括相关中... 阅读全帖
g*****9
发帖数: 349
24
请问板上给为大侠一个实际应用问题啊
小弟希望从一个Linux服务器上下载大量数据 但是数据在server上没有压缩的 希望在
下载前压缩 然后传过来 可惜的是服务器的scratch space不是很大 所以不能把文件全
打包 然后传输
请问有没有可能压缩 on the fly ,就是对单个文件实时压缩 然后传输 然后在重复下
一个文件呢? 谢谢啊~
如果能在filezilla里面实现这个就太好了。。。
谢谢啊~
g*****9
发帖数: 349
25
请问板上给为大侠一个实际应用问题啊
小弟希望从一个Linux服务器上下载大量数据 但是数据在server上没有压缩的 希望在
下载前压缩 然后传过来 可惜的是服务器的scratch space不是很大 所以不能把文件全
打包 然后传输
请问有没有可能压缩 on the fly ,就是对单个文件实时压缩 然后传输 然后在重复下
一个文件呢? 谢谢啊~
如果能在filezilla里面实现这个就太好了。。。
谢谢啊~
w*********g
发帖数: 30882
26
为什么汉语是世界上最先进的语言
一、语言水平高低的评判准则
口语,实际上是一种通讯协议。就是说,语言实际上是把人的思想通过发音器官变
成一串频率不同、波形不同的声波,然后被另一个体的听觉器官和相关的脑部组织重新
转变回思想。通讯协议,就是一个规则,一个规定了应该如何把思想/信息转变为易于
传输的信号的规则
计算机上,通讯协议有两个基本评判标准:【传输效率】和【抗噪能力】
传输效率:在单位时间里,按照该通讯协议能够传输多少信息。
抗噪能力:这种通讯方式能够在多大的噪音下仍然保证绝大多数信息正确传输。
【传输效率】又分两个方面,编码效率和传输速度
编码效率:这个通讯协议能够把一个信息用多短的一串信号来表达
传输速度:一段信号,能够以多快的速度传输
评价一种语言的口语是否先进,就要分析上面这几个问题。
文字,则是一种数据存储方式,存储格式的要求与通讯协议不同,存储格式要求储
存空间小、读写速度快,相比于读取速度,书写速度是次要的。这是因为平均下来一次
书写对应很多次阅读,而人在阅读文字上花的时间一般远远大于书写。尤其是现代社会
,手写越来越少,计算机输入、打印、印刷都大大加快了记录文字的速度... 阅读全帖

发帖数: 1
27
来自主题: Military版 - 时空压缩不是神话
时空压缩不是神话:浙大将建中国首个超重力重大科技基础设施
浙江大学
2018-03-16 20:05 来源:澎湃新闻 问政
字号
年初,经国家发展改革委正式批复,浙江大学将牵头建设国家重大科技基础设施——“
超重力离心模拟与实验装置”,项目选址杭州未来科技城,这是在浙江省建设的首个国
家重大科技基础设施项目。
“超重力离心模拟与实验装置”大楼效果图
装置建成后将成为全世界容量最大、应用范围最广的综合超重力多学科实验平台,总投
入将超过20亿元人民币。据了解,这一“国之重器”将填补我国超大容量超重力实验装
置的空白。
听起来是不是很棒,快来详细了解一下吧~
有了它,时空压缩,能量强化不再是神话
地球上的万物都受到重力的作用,物体在地球上所受的重力场为常重力场,重力加速度
约为9.8m/s2,超过这个数值称之为超重力场。例如,木星超重力场是地球常重力场的2
.33倍。超重力具有“时空压缩、能量强化”和加速相分离三种基本科学效应,可以带
给人们更多观察世界、理解世界的视角和方法。
如果重力场强度发生变化,会产生很多神奇的效应。举个例子,科学家想知道100米高
大坝的失稳性状,只需要造一米... 阅读全帖
g****t
发帖数: 31659
28
这题就是考你常用算法熟不熟.其实没有一定的解法的.
尤其是第一题,有时候peak判断是很难的.取决于噪声的性质.
第一题:
算前面n个点的导数的平均值和方差.
新点的导数>(平均值+3*方差),则认为peak开始了.
第二题:
差分法压缩.
或者列字典,把最常用的数用最短的字节编码.

【 以下文字转载自 JobHunting 讨论区 】
发信人: ThomasJ (JY), 信区: JobHunting
标 题: 今天onesite被问的两个题目
发信站: BBS 未名空间站 (Thu Feb 18 00:27:12 2010, 美东)
一个做DSP的公司, 要求用C++实现:
1. 怎么从 real time 采样的长数据串 实时 判断出 有没有peak, peak的duration。
面试者说不能等数据都采完再判断, 要随着实时数据采样, 实时判断peak
2. 还是长数据串, 但数据串中相邻数据的数值差别很小, 比如每个数据用18个bits
表示, 那么相邻数据差值在4个bits范围内, 用什么办法可以做数据压缩, 用尽量少
的bits来表示出长数据串
T*******x
发帖数: 8565
29
来自主题: History版 - 何为信息熵
信息熵是一个比较高大上的概念。其定义和理解需要一点数理基础。但是说穿了也没什
么神秘的,实际上都是我们知道的事情。最近王五抡起这个概念专门攻击中文,而且似
是而非不懂装懂,很有些国内小编的意思。有必要澄清。
先说结论:简单说信息熵就是一种语言常用字的数量,也是一种语言字符复杂度的度量
:一种语言的常用字越多,该语言文字的信息熵就越高。一种语言的字符复杂度越高,
该语言文字的信息熵也就越高。
信息熵的定义公式是:-Σp*log(p)。解释一下这个公式的意义:假设一种语言有
26个字符,假设对这种语言所写成的文章全面采样,得到一篇有10000个字符组成的文
章。p代表一个字符在该语言中出现的频率或者概率。log是以2为底的。Sum是对26个字
符进行求和。假设我们定义一个量A=-log(p),那么信息熵公式就变成Σp*A,它的含义
就是这个量A对26个字符的加权平均。
那么这个量A=-log(p)是什么含义呢?首先p是一个概率,永远小于1,所以log(p)是一
个负数,所以A=-log(p)是一个正数。那么这个数是什么意思呢?想象一下数据压缩的
目标,原理和过程:假设前面那个全面采样得到的... 阅读全帖
Z******i
发帖数: 106
30
来自主题: EE版 - MPEG 标 准
MPEG 标 准
---- 多媒体数据压缩技术的研究及其技术标准的制定是目前国际工业界和学术界普
遍关心的热点问题,特别是在网络和数字媒体产业迅速发展的今天,统一的技术标准的制
定与实施更显得尤为迫切。运动图像专家组--MPEG(Moving Picture Expert Group)是
专门从事多媒体音、视频压缩技术标准制定的国际组织,成员包括近30个国家、200多个
公司和组织的400多位专家。该组织自1988年以来,已经制定了一系列国际标准,其中MPE
G-1、MPEG-2已为人们所熟知,这两个标准为VCD、DVD及数字电视等产业的发展奠定了基
础。目前正在制定MPEG-4、MPEG-7和MPEG-21 将为多媒体数据压缩和基于内容检索的数据
库应用提供一个更为通用的平台,必将对下一代视、音频系统和网络应用产生深远的影响

一、MPEG组织的基本情况
制定MPEG标准的国际组织全称为 ISO/IEC/JTC1/SC29/WG11。ISO/IEC/JTC1(国际标
准化组织/国际电工委员会/第一联合技术委员会)是制定信息技术标准的专业委员会,JT
C1下属17个分委员会(SC),

发帖数: 1
31
证据如下
1-发信人: (TheMatrix), 信区: History
标 题: 我对神的认识
发信站: BBS 未名空间站 (Tue Aug 15 17:48:56 2017, 美东)
下面这段是我在另一个主题的回文。但是我对自己的思想很激动,所以把它单独提出一
贴:
首先我并没有收回这句话:”科学前进一步,神就退后一步“。因为我认为神就是未知
的总和。而科学就是就是向未知进发:科学进一步,未知就退一步。所以科学进一步,
神就退一步。当然,永远有未知,也就永远有神。科学是已知,是有限,神是未知,是
无限。所以科学和神的关系是已知和未知的关系,是有限和无限的关系。所以我说我们
说的是一个意思。
以上是客观的关系。下面有人了:人不能把握无限,所以人努力要把无限装入有限。第
一步就是提出一个 the totality of unknown的概念,也就是未知的总和,一下子就把
无限全概括了。数学上有一个无穷远点,可以把所有的未知收为一个点,叫无穷远点,
这叫 the one point compactification of unknown。这样有限加无限的整体,就变成
了有限再加上一... 阅读全帖

发帖数: 1
32
【 以下文字转载自 Complain 讨论区 】
发信人: dragonfly (小蜻蜓), 信区: Complain
标 题: 投诉史海钩沉版版三TheMatrix乱发帖子刷钱
发信站: BBS 未名空间站 (Tue Aug 15 22:15:35 2017, 美东)
证据如下
1-发信人: (TheMatrix), 信区: History
标 题: 我对神的认识
发信站: BBS 未名空间站 (Tue Aug 15 17:48:56 2017, 美东)
下面这段是我在另一个主题的回文。但是我对自己的思想很激动,所以把它单独提出一
贴:
首先我并没有收回这句话:”科学前进一步,神就退后一步“。因为我认为神就是未知
的总和。而科学就是就是向未知进发:科学进一步,未知就退一步。所以科学进一步,
神就退一步。当然,永远有未知,也就永远有神。科学是已知,是有限,神是未知,是
无限。所以科学和神的关系是已知和未知的关系,是有限和无限的关系。所以我说我们
说的是一个意思。
以上是客观的关系。下面有人了:人不能把握无限,所以人努力要把无限装入有限。第
一步就是提出一个 the totalit... 阅读全帖
f***e
发帖数: 332
33
来自主题: Biology版 - 冷冻电镜技术龙虎榜zz
http://www.jianshu.com/p/baa30697fc6a
什么是2015年最受科学界关注的新技术?
图片来自:nature.com
导语:
每年的岁末年初,《自然》杂志旗下子刊《自然·方法》(Nature Methods)都会盘点
当年的年度科学技术。2015年最受关注的技术为冷冻电镜技术(cryo-EM),此前呼声
很高的CRISPR/Cas9基因编辑技术未能折桂。
在冷冻电镜的这场技术革命中,华人科学家功不可没,在某些方面甚至独领风骚,做出
了诸多重大成果。
文 |张凯(剑桥大学MRC分子生物学实验室博士)
●●●
细胞里面的生命活动井然有序,每一个部分都有其特定的结构,承担不同的功能。生物
大分子则是一切生命活动的最终执行者,它们主要是核酸和蛋白。核酸携带了生命体的
遗传信息,而蛋白是生命活动的主要执行者。自现代分子生物学诞生以来的半个世纪里
,解析和分析生物大分子的结构、进而阐释其功能机制一直都是现代生命科学的核心问
题之一。
事实上,一切自然科学都涉及物质结构及结构间的相互作用为核心的研究方向,天文学
研究宇宙、星体等的结构及其相互作用,粒子物理研究物质世界... 阅读全帖
H****g
发帖数: 14447
34
【 以下文字转载自 Military 讨论区 】
发信人: Herzog (singularity), 信区: Military
标 题: 从提高信息熵的角度来说,人大代表不应重复大家都知道的信息
发信站: BBS 未名空间站 (Sun Nov 11 15:44:42 2012, 美东)
信息论有一个概念,就是熵,反映信息的不确定性。如果一个事情的结果不确定,熵值
就高;如果结果众所周知,熵值就低。从信息论出发,将冗余数据压缩后,每个bit的
数据的熵值就较压缩前提高了。换而言之,熵乘以信息的长度,就是信息含量。
考虑到五年开一次人大会,开会的时间也只有几天,所以说,从提高效率的角度说,熵
值越高,传达的信息也就越多,大会的产出也就越多了。在社会主义市场经济的情况下
,一直是强调发展优先,也就是效率第一。要提高效率,自然就要不说或者少说大家都
知道的那些信息了。
举一个例子吧。什么信息是大家都知道的呢?就是”社会主义好“。如果人大代表去开
人大会,只是重复这句话,然后很感动,这其实就是冗余信息,大家都知道嘛。因为10
多亿人都生活在有中国特色的社会主义制度里,自然是知道这个制度很好。... 阅读全帖
H****g
发帖数: 14447
35
信息论有一个概念,就是熵,反映信息的不确定性。如果一个事情的结果不确定,熵值
就高;如果结果众所周知,熵值就低。从信息论出发,将冗余数据压缩后,每个bit的
数据的熵值就较压缩前提高了。换而言之,熵乘以信息的长度,就是信息含量。
考虑到五年开一次人大会,开会的时间也只有几天,所以说,从提高效率的角度说,熵
值越高,传达的信息也就越多,大会的产出也就越多了。在社会主义市场经济的情况下
,一直是强调发展优先,也就是效率第一。要提高效率,自然就要不说或者少说大家都
知道的那些信息了。
举一个例子吧。什么信息是大家都知道的呢?就是”社会主义好“。如果人大代表去开
人大会,只是重复这句话,然后很感动,这其实就是冗余信息,大家都知道嘛。因为10
多亿人都生活在有中国特色的社会主义制度里,自然是知道这个制度很好。所以人大代
表如果要称赞,其实可以增加一些具体的数据,一些很多人未必知道的数据,这样就可
以提高信息熵了。比如说,如果是我,我也许会说,30多年前,中国只有10%的人能享
受到公费医疗,近乎免费的住房,近乎免费的教育。而今天呢,中国超过10%的人能享
受到公费医疗,近乎免费的住房,近乎免费的... 阅读全帖
t*******r
发帖数: 22634
36
童鞋们俺犯了重大错误,俺后期做了压缩。俺以为压缩不改变
啥,复查发现压缩狠了让音色变闷。。。实验数据错了,前面
的观点要重新来过。。。俺重新上传了没有做任何后期压缩的,
后期只加了个混响。。。这样才是 apple-to-apple 的比较。
看来以后俺录歌压缩可能都没法做太多了。。。音量要自己唱好
。。。否则只好手工修音量。。。
j******f
发帖数: 2109
37
来自主题: CellularPlan版 - FreedomPop手机计划【攻略】
http://info.tele.hc360.com/2016/01/121013523284.shtml
解码虚商FreedomPop成功秘笈:让免费用户为付费业务埋单
http://www.tele.hc360.com2016年01月12日10:13 来源:通信世界周刊T|T
【慧聪通信网】FreedomPop的目的并不是做虚拟运营商,而是通过自己的技术转换
平台帮助其他运营商获得成功。”12月底的一个上午,在北京金宝街的一家咖啡厅,
FreedomPop国际业务CEONicholas向记者表示。此前一天,他刚刚从美国飞抵北京,与
一家虚拟运营商洽谈合作,而两天之后他将飞往马来西亚,同样也是为了业务合作。
提起国际市场上比较领先的虚拟运营商,FreedomPop是个不得不提的案例。这家成
立于2012年的新兴公司传奇之处在于,通过免费业务吸引用户入网后,能够成功地将其
中近50%的用户转换为付费用户,让他们乐意为FreedomPop的后续服务埋单。在“免费
为王”的互联网环境中,通过“免费的午餐”吸引用户并不难,但是要让用户在享受完
免费服务之后花钱继续使用业务就比... 阅读全帖
j******f
发帖数: 2109
38
来自主题: CellularPlan版 - FreedomPop手机计划【攻略】
http://info.tele.hc360.com/2016/01/121013523284.shtml
解码虚商FreedomPop成功秘笈:让免费用户为付费业务埋单
http://www.tele.hc360.com2016年01月12日10:13 来源:通信世界周刊T|T
【慧聪通信网】FreedomPop的目的并不是做虚拟运营商,而是通过自己的技术转换
平台帮助其他运营商获得成功。”12月底的一个上午,在北京金宝街的一家咖啡厅,
FreedomPop国际业务CEONicholas向记者表示。此前一天,他刚刚从美国飞抵北京,与
一家虚拟运营商洽谈合作,而两天之后他将飞往马来西亚,同样也是为了业务合作。
提起国际市场上比较领先的虚拟运营商,FreedomPop是个不得不提的案例。这家成
立于2012年的新兴公司传奇之处在于,通过免费业务吸引用户入网后,能够成功地将其
中近50%的用户转换为付费用户,让他们乐意为FreedomPop的后续服务埋单。在“免费
为王”的互联网环境中,通过“免费的午餐”吸引用户并不难,但是要让用户在享受完
免费服务之后花钱继续使用业务就比... 阅读全帖
y****g
发帖数: 36950
39
来自主题: Joke版 - ipad3 屏幕升级的后果 (转载)

高解析度时像素填充速度不够是可能的,GPU指标快都是加速没shader的三角形,如果
上了2,3层带alpha的材质叠加运算速度立马就下来了。就好像PC游戏玩FPS一遇到角色
要穿越大面积的爆炸烟雾一类的粒子效果时,游戏往往瞬间从30多帧丢到10来帧。
我觉得原文对游戏app rom size的质疑也是有道理的。app现在越做越大,如果要为高解析度屏幕
设计3D游戏。贴图尺寸会大很多,1024x1024带alpha的32位真彩图片不做mipmap,保证质量不有损
压缩的话要4M,如果屏幕达到2048,一个3D角色要有近景镜头,面部贴图要做2048x2048的话,贴
图就要用16M内存,不过用了压缩贴图会小很多,但是效果会比较差,rom里的贴图数据压缩也要
1M多。而UI的贴图一般是不好压缩的,因为UI强调干净整齐的边缘和干净的色彩,压缩的贴图做
UI很难看。这样loading速度也会变慢。
如果有过场动画,做720P的,1分钟码率中等的的h264 MP4,大概要20几M,既然硬件提升,按照
PSvita的3D游戏做法,这么个游戏做出来很可能rom就要1GB。
l**n
发帖数: 7272
40
【 以下文字转载自 PDA 讨论区 】
发信人: yugong (愚公挖坑), 信区: PDA
标 题: Re: ipad3 屏幕升级的后果 (转载)
发信站: BBS 未名空间站 (Fri Feb 24 00:37:22 2012, 美东)
高解析度时像素填充速度不够是可能的,GPU指标快都是加速没shader的三角形,如果
上了2,3层带alpha的材质叠加运算速度立马就下来了。就好像PC游戏玩FPS一遇到角色
要穿越大面积的爆炸烟雾一类的粒子效果时,游戏往往瞬间从30多帧丢到10来帧。
我觉得原文对游戏app rom size的质疑也是有道理的。app现在越做越大,如果要为高
解析度屏幕
设计3D游戏。贴图尺寸会大很多,1024x1024带alpha的32位真彩图片不做mipmap,保证
质量不有损
压缩的话要4M,如果屏幕达到2048,一个3D角色要有近景镜头,面部贴图要做
2048x2048的话,贴
图就要用16M内存,不过用了压缩贴图会小很多,但是效果会比较差,rom里的贴图数据
压缩也要
1M多。而UI的贴图一般是不好压缩的,因为UI强调干净整齐的边缘和干净的色彩,压缩... 阅读全帖
w*******x
发帖数: 489
41
【 以下文字转载自 Computation 讨论区 】
发信人: woshialex (Qi), 信区: Computation
标 题: 有人知道浮点数的压缩算法吗?有损也没关系
发信站: BBS 未名空间站 (Sat Oct 23 10:12:16 2010, 美东)
我的问题里头内存严重不够用,所以需要把很多浮点数数组(单精度吧)压缩,然后调
用的时候在内存里头一个数组一个数
组的解压缩。
有人知道有效的算法吗?能压缩几倍?即使适当的loss也没关系。数据有大片区域比较
平滑。
谢谢!
G*s
发帖数: 856
42
下面的是不是钓鱼问:
发信人: liai (科学家), 信区: Military
标 题: 孙景泽:解开60年代人口变动真相,破解国家统计局户籍统计数据矛盾之谜
发信站: BBS 未名空间站 (Wed Mar 30 22:58:04 2011, 美东)
孙景泽:解开60年代人口变动真相,破解国家统计局户籍统计数据矛盾之谜
孙景泽
破解国家统计局户籍统计数据矛盾之谜
——关于我国六十年代人口变动问题
孙景泽
(本文原文是一篇学术研究论文,使用了较多的数学语言和推导,篇幅也较长。为了便
于更多的读者能够了解本文的观点,写了这篇压缩稿。)
本文提要
一、 由于我国工业发展和生产大跃进,1956年­至1959年期间出现了从农村到城市
人口大迁移,在大迁移中出现重报、虚报户籍人口1144万人。这些重报、虚报的户籍在
1960年至1964年期间被注销。
由于遇上经济困难,我国在1960年9月至1964年期间进行了城市人口大精简工作,形成
了从城市到农村的人口大迁移,在大迁移中有1510万人口漏报了户籍。上述漏报户籍人
口中的绝大多数在1... 阅读全帖
s*****V
发帖数: 21731
43
原标题:这一次从钢铁开始
记者 张向东 董瑞强

这是一场50万人的大迁移。
它不是春运,但其过程之艰难、波及范围之广、对中国经济未来影响之深远,无人
敢低估。
迟京东采用目前中国钢铁企业人均吨钢生产率,粗略计算出了这个数字。这位中国
钢铁工业协会副会长说,按照2016年1月22日国务院常务会议提出的再压缩粗钢产能1亿
到1.5亿吨的目标,目前中国钢厂人均产钢300吨,此轮钢铁去产能意味着,将有50万左
右的钢铁职工面对调整或重新选择。
指导这场50万人迁徙的纲领性文件名为《关于钢铁行业脱困指导意见》,目前已获
得国务院批复,或将在春节后正式下发。与此同时,与这份文件相关的8份具体配套政
策文件,也即将由相关负责部门起草完毕,这些配套政策分别涉及财政、银监、环保、
安监、土地等内容。
1月26日下午,中共中央总书记、国家主席、中央军委主席、中央财经领导小组组
长习近平主持召开中央财经领导小组第十二次会议,在这次会议上,习近平对国家发改
委、财政部、工信部、国资委、央行等八个部委要求称,研究供给侧结构性改革方案,
“情况要摸清、目的要明确、任务要具体、责任要落实、措施要有力”。这5个具... 阅读全帖
G***Y
发帖数: 9698
44
经济萎靡压缩美家庭规模 独生子女30年增一倍
2013-08-09 17:31:02 来源:中新社
尽管美国今年的畅销书之一《一个且唯一》极力颂扬一个孩子的好处,但现实是,美国
数以百万计的工薪阶层家庭根本就承担不起再养一个孩子。迫于不断增加的日常生活和
教育消费压力,美国只有1个孩子的家庭数量在30年间激增了一倍,如今每5个家庭中就
有1个是独生子女家庭。
人口普查局最新数据显示,美国独生子女家庭的数目在不断增加。近40年,美国新增了
约1600万独生子女家庭,每5个家庭中就有1个。大约18%的已婚妇女在其生育年龄内只
生一个孩子,比30年前增加了一倍。
研究者表示,基本不再考虑生育的40至44岁间的美国妇女,养育一个孩子的比例也从
1976年的10%,升至目前的19%。
全美广播公司报道称,过去5年美国经济的疲软使美国人生育率大幅降低。独生子女家
庭壮大的趋势已很难被忽视,但往往被情绪化的论调掩盖了重要的经济因素。女记者桑
德勒(Lauren Sandler)2013年出版的新书《一个且唯一》,推崇自由、快乐地养育一
个孩子,告诉妈妈们其中的优势和乐趣。但这很难帮助那些... 阅读全帖
t*****n
发帖数: 4908
45
你可以增量备份每天的数据。能实现的软件很多。搞得好几个G就够了。
其次要压缩。几个G的数据有可能压缩到10%以下。
b*****d
发帖数: 61690
46
【多维新闻】10月8日上午,广东省委书记汪洋到省财政厅进行专题调研。汪洋给广东
财政厅全体官员推荐了《大数据:正在到来的数据革命》一书,希望财政系统官员更加
重视数据的收集、分析和使用,坚持用数据说话、用数据改进管理、用数据推动创新。
要真正把钱花到刀刃上
2007年至2011年,来源于广东的财政总收入从77,51亿元增加到13,668亿元,年均递增
15.23%。汪洋充分肯定全省财政工作并表示,广东正处于经济社会发展的转型期,财政
收入从高速增长期步入平稳增长期,要根据新形势新任务的要求改进税源培植工作,既
要抓那些可以给财政带来明显增长的重点项目,更要转变观念、着眼长远,打造法治化
、国际化营商环境,为企业发展壮大创造更好外部条件,实现财政可持续增长。
汪洋表示,广东省的财政总量虽然大,但支出压力也很大,部分资金使用效率不高,“
重分配、轻管理”、“重作用、轻绩效”的情况依然存在,要加强财政预算管理,增加
资金使用透明度,优化支出结构,真正把钱花到刀刃上。
要坚持用数据说话
汪洋说,要增强为群众办实事办好事的感情和责任,忠于职守,简政放权,规范权力运
行,压缩权力“寻租”空间,打造... 阅读全帖
1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)