由买买提看人间百态

topics

全部话题 - 话题: encoding
1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)
G***y
发帖数: 1082
1
来自主题: Biology版 - 对ENCODE价值感兴趣的同学请进
强烈建议大家去看看Ewan Birney (ENCODE lead analysis coordinator)的blog:
ENCODE: My own thoughts http://genomeinformatician.blogspot.com/2012/09/encode-my-own-thoughts.html
我感觉他对整个项目的评价还是比较客观全面的。比看press release,新闻什么的强
的多。
“But in telling the story over and over, only parts of it get picked up
here and there – the shiny bits that make a neat story for one audience or
another. Here I’d like to add my own voice, and to tell at least one person
’s perspective of the ENCODE story uncut, from beginning to end.... 阅读全帖
i***l
发帖数: 9994
2
来自主题: Hardware版 - 尼玛,google的VP9 encoding这么弱?
http://iphome.hhi.de/marpe/download/Performance_HEVC_VP9_X264_P
看起来连现在流行多年的h264都不如,和h265比更是差的太多。
“A performance comparison of H.265/MPEG HEVC, VP9, and H.264/MPEG AVC
encoders was presented. According to the experimental results,the coding
efficiency ofVP9 was shown to be inferior to both H.264/MPEG AVC and H.265/
MPEG HEVC with an average bit rate overhead at the same objective quality of
8.4% and 79.4%, respectively. Also, it was shown that the VP9 encoding
times are larger by a factor of more... 阅读全帖
q**j
发帖数: 10612
3
来自主题: Internet版 - [转载] IE language Encoding
【 以下文字转载自 Windows 讨论区,原文如下 】
发信人: qqzj (atrest), 信区: Windows
标 题: IE language Encoding
发信站: Unknown Space - 未名空间 (Fri Nov 19 13:47:43 2004) WWW-POST
我用的是windows 2000. My default language in control panel -> regional and
language setting is set to "English (United States)". 我有个LANGUAGE 的问题:
打开IE, 逛逛 www.msn.com, 有些字是encoded,小方块. 于是我点右键,想ENCODING, 选
的是western enropean (windows), 于是我换成 Unicode(UTF-8), 还是小方块. 我还选
了AUTO SELECT, 还是这样.
请大侠们帮我分析分析, 为什么会这样?
b***y
发帖数: 2799
4
来自主题: Programming版 - [合集] how to know the encoding of a file
☆─────────────────────────────────────☆
davidwang (dd) 于 (Wed Feb 20 16:14:03 2008) 提到:
It's like this --
I have a C++ application which will read and parse an input file, then write
the result parsed to database. I need to know the encoding of the input
file to set the NLS_LANG variable. For example, if the file is encoded in
UTF8, NSL_LANG will be set '.UTF8'.
Question is, how I can detect this file is encoded in UTF8 etc. in C++.
Anybody ran into the same problem before?
Many thanks!
☆──
b****r
发帖数: 17995
5
我一直做遗传,ENCODE的东西不说天天用,一直还是用得挺多的,还真没听过谁吹
ENCODE有那么重要,感觉比HGP差老鼻子了。这就是个工具吧,但是确实是个非常有必
要的工具,不然对经常搞DNA的人太痛苦了。以前这些genome 水平的data这个做一点那
个做一点,都是乱糟糟的,然后乱糟糟地整合在一起,错误百出,互相之间很多不
match。如果你没有专门玩DNA,可能对这个问题体会没有我们深,take it for
granted了。
再加上encode还加上了很多功能性基因组的东西,比如大量wetlab来源的基因组水平的
ChIP(包括各种细胞内的各种转录因子,histone modification,DNAmethylation等等
),基因表达,已知的基因多态/突变 全部相当准确地整合到了一起,我觉得对于只要
是和DNA有关的研究都会很有帮助的,后续的cancer genome,信号转导,干细胞和分化
等等都会大大受益,更别说我们这些本来就是做遗传的人了。
2个亿,我觉得非常非常值得。

有1
c*******0
发帖数: 190
6
我很同意您的说法。ENCODE里面表观遗传的信息解析还是有很大的应用价值的,特别是
对于将来的Environmental genetics来说,这个是能对医学起到巨大作用的。可能我对
基础生物学的见解还不够深,我的本意并不是否定ENCODE这个项目,它的存在确实有之
合理性。只是在我看来,对于phenotype的调控研究相较genotype层面的网络描绘更有
意义。ENCODE里太多关于基因层面的空间调控网络的描述,这些东西我想不管多高深的
计算模型都难以模拟,因为能trigger这些调控的外界因素太多太不可预测了,现在的
技术连72小时天气预报都很难准确预测,蝴蝶效应的reaction chain可以说短时间内无
解。我不是纯生物背景出身,本科上的医学院,10几年来国内的医学教材现在该出到第
7版了吧,遗传学的发展体现到疾病谱上的内容依然只限于开头的“致病原因可能与遗
传有关”而已。我想,如果花这2亿去构建一个足够详尽的数据库,关于各种不同内外
理化环境因素对phenotype改变的关联,真正发挥出epigenome的桥梁作用,可能会更有
指导性的价值。太多关注于基因层面的相互影响,... 阅读全帖
g*********3
发帖数: 177
7
我比较同意你说的三大块~ 另外ENCODE稍微做了下和各种SNP的overlapping,另外试着
test了一些很basic的假说~
ENCODE的histone antibody个人认为是可靠的,他们有好几篇paper(包括此前的专门一
篇test antibody的paper)是专门test antibody specificity的,基于WB和MS,QPCR..
.我觉得就差不多了~
我觉得你说的数据差异大,应该是生物学的本质...
另外,我们可能还需要更多的数据来告诉那些combinations of histone marks才是真
正的informative...这个在ENCODE里才刚刚开始~
d****7
发帖数: 109
8
不知道之前有人发过没,这篇文章从进化的角度来探讨ENCODE里的数据,尤其是对“
junk dna vs garbage dna”的观点以及探讨读起来很有启发性
这篇不是research article,读起来很enjoyable
http://m.gbe.oxfordjournals.org/content/early/2013/02/20/gbe.ev
One quote from the article:
So, what have we learned from the efforts of 442 researchers consuming 288
million
dollars? According to Eric Lander, a Human Genome Project luminary, ENCODE
is the
“Google Maps of the human genome” (Durbin et al. 2010). We beg to differ,
ENCODE is
considerably worse than even Apple Maps.
d********f
发帖数: 43471
9
【 以下文字转载自 Biology 讨论区 】
发信人: cy0708040 (青春之后,认输之前), 信区: Biology
标 题: Re: 没人说说ENCODE数据库发布的事情?
发信站: BBS 未名空间站 (Thu Sep 6 11:32:59 2012, 美东)
再算一笔糊涂账:
ENCODE据报道参与科学家是442人,2个亿,人均500万美刀。
2个亿烧出6篇nature,2篇science,1000多万刀一篇...NIBS笑而不语。
真心不觉得有多牛13啊...
f******k
发帖数: 26
10
【 以下文字转载自 Programming 讨论区,原文如下 】
发信人: formrock (hunting), 信区: Programming
标 题: Create and register Media Encoder plugin
发信站: Unknown Space - 未名空间 (Tue Jun 29 17:01:24 2004) WWW-POST
It is easy to create Media Player Plug-ins. There is a wizard.
But how can I create encoder plugin.
Any one have experience?
Thanks a lot.
t***q
发帖数: 418
11
求教, python 对于很奇怪的字符的encoding 怎么处理?一般用 encode('utf-8') 就
够了。但是问题里遇到这样一个string,utf-16都不能处理。字符如下:怎么办?多谢!
1╜ Knights: Search of Ravish Prins
t***q
发帖数: 418
12
求教, python 对于很奇怪的字符的encoding 怎么处理?一般用 encode('utf-8') 就
够了。但是问题里遇到这样一个string,utf-16都不能处理。字符如下:怎么办?多谢!
1╜ Knights: Search of Ravish Prins
m******r
发帖数: 1033
13
来自主题: Programming版 - encode high cardinality categorical features
什么叫做binary encoding ? 比如我一个变量有8层, 分别代表8个州,NY,CA,TX,NY,
etc
然后你用3个变量做binary encoding?? 000, 001, 010,110,... 111 ??
看起来不太对劲吧?
s***t
发帖数: 195
14
I recieved an email with an attachment encoded by Mac BinHex 4.0
After saving the attachment in pine, it is still encoded.
How to decode it?
Thanks!
m**i
发帖数: 724
15
我刚用windows media encoder 9 把一个 vob file 转成了wmv.
我觉得这东西很有前途。这有两层意思。
第一,在我目前的机器上(piii 667, 512m, nvidia32) 运行效果不好,会跳帧。
第二,如果你又一个非常"powerful" (dual cpu or a P4 with a good video card) 的
机器,其效果会很好。加上几乎是 one click 的操作。可以想见以后备份dvd 将不太难

优点:
1. 操作简单,一步到位。(转 camcorder 的文件应该很合适。我是过 win encoder 7.)
2. 图像效果不错。
3. 我转的5分钟dvd 没有 out of sync 的问题。
4. 压缩比合适。(dvd 720*480 to 360*240 500 kbps, 约1:6)
5. 界面好。有 support. free! (up to now。)
问题:
1. 不能用 window media codecs 和 iso mpeg 4 之外的 codec.
2. 编辑工具还不多。
3. 需要 very p
c*******0
发帖数: 190
16
但是HGP, ENCODE这种项目大比例的数据实际上就是为了烧钱烧进paper里而已,能有1
%的转化为社会价值就得谢天谢地了。HGP完成之前,各种预言其重要性的报道比今天对
ENCODE的有过之而无不及吧。10年过去了,我相信大部分人没从其中得到任何实质性的
益处吧。我不反对我目光短浅,不过对个人来说,一辈子没几个十年。相比曼哈顿、阿
波罗这种大工业项目,我觉得生命科学研究成果的见效时间尺度应该更短一些。况且我
也不认为测序、生物信息学是了解生命与疾病本源的唯一途径。
P.S. 我不是科学愤青,一介穷书生而已,只是觉得大部分时候媒体把有些东西夸大得
有点过了。
M********n
发帖数: 31
17
ENCODE这东西太general,就像一本《永乐大典》、《四库全书》
其实,没有什么novel的findings,就是编了一本dictionary,或者用他们的话说
catalog而已
ENCODE里面比较有用的,也就是他们做的TF的map吧
(请看他们paper之一:“Circuitry and Dynamics of Human TF Regulatory
Networks”)
他们用的是DNase footprinting
给我的感觉是,false positives 太多
每个cell-type多达800多万个binding sites
这不是问题,问题是,知道这些sites
本身没用,要知道什么TF bind到这些sites
最终他们还是用了TRANSFAC的数据
在TRANSFAC里有出现的binding sites留下,其他滤掉
这相当于什么都没做
u*********1
发帖数: 2518
18
新出炉的ENCODE的regulome的数据库
http://regulome.stanford.edu/index
我想问下,哪里有完整的database可以下载的?这样就可以自己在terminal里分析,而
不是一个个的在browser里query
download里能下载的只有Category1,2,3
另外还有一个问题,
能下载的Caterogy1/2/3的文件的format是:
SNP_name chr1 100 All evidences from ENCODE (say, chip-seq, DHS)
我就是说我能下载到的文件都是提供noncoding SNP和对这个noncoding SNP的
annotation
但如果在browser里直接搜索,随便输入一个coordinate,哪怕不是SNP,也会告诉你这
个位点的score是多少。
也就是说,这个背后肯定有都每个位点的annotation的数据库,而这个数据库目前我下
载不到。
谢谢!
b*******a
发帖数: 17
19
【 以下文字转载自 EE 讨论区 】
发信人: boyangeda (疙瘩), 信区: EE
标 题: 求一篇paper A Survey of Various Encoding Schemes and Associated Placement Algorithms Applied to Packing
发信站: BBS 未名空间站 (Tue Oct 4 01:28:19 2016, 美东)
A Survey of Various Encoding Schemes and Associated Placement Algorithms
Applied to Packing and Layout Problems
Santosh Tiwari, Georges Fadel and Vladimir Gantovnik
[-] Author Affiliations
Santosh Tiwari, Georges Fadel, Vladimir Gantovnik
Clemson University, Clemson, SC
Paper No. DETC2006-99271, pp.... 阅读全帖
d*****u
发帖数: 17243
20
来自主题: Military版 - DNA怎么encode各种复杂的本能行为
DNA怎么encode各种复杂的本能行为?
这怎么解释的
c********p
发帖数: 1969
21
来自主题: JobHunting版 - 啥叫encode/decode binary tree啊?
看别人面经看到的。啥意思啊?
怎么个encode/decode法啊?
j********r
发帖数: 25
22
Question: Implement a Codec.
=> =>
Abckkkkkkkkkkks55p=> Abc11xk55p => Abckkkkkkkkkkks55p
也就是说,对于两个以上的重复字符,编码成
[n]x[c] where n is the repetition count and c is the actual
character,
比如以上的11为k的重复数,x是特殊字符,k是重复的字符。
中间会有special case, 比如:
Abc5xp, If you directly output above sequence, the decoder could decode it
as:
Abcppppp,
这种情况你应如何处理.
a******e
发帖数: 710
23
两个问题
1. Abckkkkkkkkkkks55p=> Abc11xk55p => Abckkkkkkkkkkks55p
55前面的s去哪里了? 是typo么?
2. Abc5xp这个不就是应该decode成Abcppppp么?
我猜你想问的问题是这个吧?
如果原来字符串就是Abc5xp的话,要encode成什么?
b**m
发帖数: 1466
24

encode是对x特殊处理,转成1xx
数字也要特殊处理,5-> 1x5.
aa51x -> 2xa1x51x11xx
j********r
发帖数: 25
25

[jobhangter] yes, it's typo, should be:
1. Abckkkkkkkkkkks55p=> Abc11xks55p => Abckkkkkkkkkkks55p
[jobhangter] Yes, what if the source string is Abc5xp, how do you encode it
. especially how to write code to handle the special cases.
w****n
发帖数: 17
26
gstreamer 做mp4 video editing, 除了samsung s5 其他手机都能工作,在samsung报
“unable to start video encoder, closing gstreamer", 是为什么?或者有什么好
的tutorial关于这个方面的能推荐一下,小弟不胜感激。
S*******C
发帖数: 822
27
来自主题: JobHunting版 - Array Length encoding求思路!
Array Length encoding: 给定binary数组(比如[1010]), 计算每个digit数量, 返回这
种形式([11011101]).
写到一半, 小哥说你再写代码么,我这里没显示, 后来复制+刷新+粘贴搞定(
collabedit的bug),虚惊一场. 期间讨论比较多,比如array resizing(后来用了
ArrayList), input的边界条件等, lz拙计的听力, 一路pardon过来......
follow up: 怎么设计testcase, 我说random生成0,1, 又问怎么知道输出是对的?这
里纠结了好久,一开始以为要再写一种方法判断正确性. 后来发现小哥的意思是random
生成的input如何通过output判断是不是正确的,我说生成好以后存起来或打出来,然
后和output对照, 小哥说make sense.(lz感觉这里好像是领会错意思了,还浪费了不少
时间, 求问大家这里小哥到底想问什么。。。)
H********y
发帖数: 3322
28
来自主题: NewYork版 - Encode真不是CPU干的事~~~~~~~~
作视频了发现剪辑师不是人干的事~~~~~~~~~~~~~~~
剪完了输出发现ENCODE不是CPU干的事~~~~~~~~
巨慢. 10分钟前告诉我还有3小时50分中, 现在告诉3小时57分中.阿
才一个小时的片子~~~~~~~四核的U呀~~~~~~~8 硬盘 raid5呀~~~~~~~~8GB RAM呀~~~~~~
~~800W的电源呀~~~~~~~~~~~
年底要不要升到8核呢?
突然觉得好像我的车, 废油,还得是93号的, 但是跑不快。
c*****n
发帖数: 75
29
用wireshark看首页的packets,
text/plain, text/html的content-encoding都是gzip.
有的文件很小。
为啥?
b*********n
发帖数: 1258
30
【 以下文字转载自 Programming 讨论区 】
发信人: babyfacenan (黑土), 信区: Programming
标 题: 请教:如何用Java get URL content是.swe并且是utf-16 encoding的文件
发信站: BBS 未名空间站 (Tue Mar 4 01:46:50 2008)
url指向一个 .swe 文件,这个.swe文件是utf-16的
用less看不了,要用iconv 从 utf-18 转换成 utf-8才能用less看
我用了java URL class, url.openStream()等等来get content
complain 是什么http error 400 之类的
试了一下别的url,没问题,就是这个url报error
不过这个url本生肯定也没问题,url指向的.swe文件用firefox打得开
我用了perl的http request, userAgent, 加上
`iconv -f utf-16 -t utf-8` 就可以把content弄下来
并且存成一个less可以看得了的文件
也不知道我有没有把
j****n
发帖数: 107
31
来自主题: DotNet版 - Windows Media Encoder 的问题
在encode不带声音的video时会出error. 必须去掉audio source:
IWMEncSource SrcAud = SrcGrp.AddSource(WMENC_SOURCE_TYPE.WMENC_AUDIO);
SrcAud.SetInput(sFileName, "", "");
可是我怎么判断video有没有声音呢?
h**y
发帖数: 398
32
【 以下文字转载自 BuildingWeb 讨论区,原文如下 】
发信人: husy (狐少爷~Greenseer), 信区: BuildingWeb
标 题: 请问如何改变Oracle 9i AS中JVM的default encoding
发信站: The unknown SPACE (Tue Jul 1 03:42:58 2003) WWW-POST
如题,
现在是ASCII, 怎样才能改成ISO-8859-1?
谢谢
c*****t
发帖数: 1879
33
Currently, i am setting WindowsXP to be Chinese w/ English menus.
However, when I run Java or Java applications (such as DB2 tools),
it all turns up in Chinese or some square boxes. Switching back
the system to English would make all the menus/buttons to be English,
and that's what I prefer.
So the question is, how to set the Java runtime locale/encoding
such that I can run applications in English with Windows XP setting
in Chinese?
Thanks.
S***d
发帖数: 1802
34
With firefox.
If you set Chinese font under Simplified Chinese, it is only gonna work for
the Chinese under GB encoding, but if it is UTF-8, it is not gonna work.
c**t
发帖数: 2744
35
来自主题: Programming版 - How to encode YYYY-MM-DD?
It's easy to use one character to reprent either month or day; The maximun
one
is 31. (we have 0-9A-Z total 36 to use); but for year, assuming using two
digits, there are 100 possibilities, may use ascii to reprent....
Is there better idea to encode a date?
s********k
发帖数: 6180
36
auto encoder能比PCA更好的映射到embedding space,是不是单纯的PCA没啥用处了?
除非及其简单的数据集
g*******u
发帖数: 3948
37
来自主题: Programming版 - encode high cardinality categorical features
打算 lightgbm or xgboost
有几个 categorical features 有5000个不同的值。 这种怎么encode ?
谢谢
另外一般说high cardinality categorical features 多少个算是high?
thx
m****o
发帖数: 182
38
来自主题: Programming版 - encode high cardinality categorical features
binary encoding : 2^12 = 5000

发帖数: 1
39
来自主题: Programming版 - encode high cardinality categorical features
binary encoding是一个值得一试的办法。类似的还有hashing trick。
除此之外,google "supervised ratio" 和 "weight of evidence",把categorical变
成numerical。
还有就是看level distribution,如果是几个major level和一大堆minor level,
minor level数量小过某个阈值,比如总feature数乘十这种,也可以考虑合并minor
level。
m****o
发帖数: 182
40
来自主题: Programming版 - encode high cardinality categorical features
word2vec除非你的inputs是有context的概念,一个 input前后跟着其它input,有
temporal dependency,才可能用上。binary encoding效果肯定不如1hot,但是是一个
好的starting point。feature engineering从来都是一个反复有反复的过程。但是一
切反复都要有个起点。
h***h
发帖数: 229
41
来自主题: Security版 - JPG 文件被改成了.JPG.ENCODED
不能打开了,但是文件还是原来的大小。
文件的属性变成了encoded file,无论用什么看图片的软件都打不开了。
求助,多谢多谢!
M******l
发帖数: 443
42
来自主题: Software版 - [转载] Re: Help - about MP3 encoding
【 以下文字转载自 Music 讨论区 】
【 原文由 babe 所发表 】
320kbps稍微高了一点. 他们盲听的结论是定比压缩256kbps和CD的pickup
比例相同, 90%的128kbps的MP3被kick out. 所以256kbps相当于CD音效. 但是
256kbps还是太占地方了, 实验结果用LAME的V1变比例压缩可以获得最好的
quality/size ratio, 非常accurate. 这也是我们studio目前统一采用的标准. :-)
关于cd ripper和mp3 encoder有很多争论. 我们现在用的是 r3mix.net的
建议. ExactAudioCopy0.9pb7 + LAME 3.87b MMX. VBR 用 "-V1 -mj -b128 -q1 -h"
CBR 用 "-b256 -ms -h". 有兴趣可以去那里看看他们的讨论.
回到shell的问题, 降低mp3 rate的软件俺从来没有听说过. 不过既然
novrain有CD, 那就由flyingskull studio来重新做一边吧. 我们studio不能
l******d
发帖数: 1633
43
encoding不是靠猜前几个字节的么?找个hex editor看?
c*******0
发帖数: 190
44
对这种宏观技术流的项目还是保留谨慎的乐观;HGP完成10年来,除了高通量测序技术
爆炸式的发展使个体测序接近突破1000美刀以外,还看不到其具体为生物医学或临床实
践带来的革命式推动,近30年来疾病谱基本没有太大的改变。以技术为导向的生物学研
究终究还是缺少一点灵魂。ENCODE的框架太大,看上去吓人一跳,实际只是把一些已知
的不成系统的基因调控网络归档化、IT化而已,不知道10年后能创造些什么惊世骇俗的
东东。
c*******0
发帖数: 190
45
再算一笔糊涂账:
ENCODE据报道参与科学家是442人,2个亿,人均500万美刀。
2个亿烧出6篇nature,2篇science,1000多万刀一篇...NIBS笑而不语。
真心不觉得有多牛13啊...
M********n
发帖数: 31
46
是12.3亿美元,不是2亿美元
The new data come from the Encyclopedia of DNA Elements project, or ENCODE,
a $123 million endeavor begun by the National Human Genome Research
Institute (NHGRI) in 2003, which includes 442 scientists in 32 labs around
the world.
Read more: http://healthland.time.com/2012/09/06/junk-dna-not-so-useless-after-all/#ixzz25wLTEg49
b****r
发帖数: 17995
47
你这个说法有点搞笑
这种consortium本来就是以service为目的而不是以直接discovery为目的。service在
你看来就是浪费钱。你从来不用你们学校任何core facility的service吗
你应该去问问最近在function genome方面有重大discovery的那些作者,有几个没有用
到过ENCODE的。完全没有用过的我猜想最多到不了50%

by
a*******a
发帖数: 4233
48
没看文章只看了个摘要
似乎ENCODE主要分3大块
一块是tf的binding
一块是组蛋白甲基化修饰的分布
一块是测出来一大批新的none coding RNA
然后再把这三块比来比去看有没有相关性。
不知我有没有抓住关键的点。
我觉得none coding RNA肯定是有用的
在各个肿瘤或者其他疾病里比来比去肯定能找到东西。
组蛋白修饰就不好说了,他们是用chip-seq做的
组蛋白甲基化修饰的抗体特异性很难说
而且随环境和技术影响变化很大,可重复性不好。
当年eric lander不是提出个es全基因组的bivalent domain概念么?
我们也重复过chipseq,不能说我们重复不出来,至少可以说数据差异很大。
组蛋白修饰本来就是会变的,再加上种种实验上的变量,最后能有多大参考价值很难说。
B*********r
发帖数: 19
49
怎么没人提GWAS结合ENCODE的应用呢?之前的大把大把的NG paper,不知道又要出多少
后续的版本了
1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)