第6页 - 关于readlines的讨论汇总 - 话题女王

全部话题 - 话题: readlines

c******2
发帖数: 957

来自主题: Programming版 - 上次的题目继续求助~~~python输入词组各单词大写首字母之后

您用的版本是不是和我不一样的？我的是python3.2
因为我输进去之后，有好些地方说SyntaxError: inconsistent use of tabs and
spaces in indentation不知道是怎么回事呀。。。
如果有时间，能不能麻烦您也帮忙看看我和同学讨论出来的还是有错误的一段代码：
def main():
print("Please input the filename to read: ")
f2read=input()
print("Please input the filename to write: ")
f2write=input()
f1=file(f2read, "r")
f2=file(f2write, "w")
def acronym(string):
p=string.split("")
for word in p:
s+=(word[0].upper())
return s
lines=f1.rea... 阅读全帖

r*******n
发帖数: 3020

来自主题: Programming版 - python比java慢这么多呀

我按你的思路改了一下,看效果有没有改善, 然后再用pypy试试.
def process_file(input_file, output_file):
pos = 10
valueMap = dict()
cnt = 0
output = []
with open(input_file, 'r') as f:
lines = f.readlines()
for each_line in lines:
vals = each_line.split('\t')
val = vals[pos]
if val == '' or val == 'null':
continue
else:
if val not in valueMap:
valueMap[val] = len(valueMap) + 1
... 阅读全帖

r*******n
发帖数: 3020

来自主题: Programming版 - python比java慢这么多呀

c*********n
发帖数: 128

来自主题: Programming版 - Python擂台:算24点

这程序恰好我以前写过，哈哈。interface稍微不一样，懒得改了，直接贴过来。
import sys
from itertools import permutations
#from operator import __add__
EPS = 0.0000001
isEqual = lambda x, y: [False, True][abs(x-y) def main():
line = sys.stdin.readline()
numbers = map(float, line.split())
if(len(numbers) == 0): numbers = [2.0, 2.0, 3.0, 5.0]
xs = map(X, numbers, map(str, map(int, numbers)))
expressions = []
findExpression(expressions, 24.0, xs)
print '\n'.join(set(expressions))

class myoperator... 阅读全帖

r***6
发帖数: 401

来自主题: Programming版 - 怎么样实现fuzzy join

#!/usr/bin/python
f1 = open("f1.csv")
f2 = open("f2.csv")
ts2 = 0
line2 = "\n"
for line1 in f1:
ts1 = int(line1.split(",")[0])
while ts2 <= ts1:
nextline2 = f2.readline()
if not nextline2:
break
ts2 = line2.split(",")[0]
if ts2 <= ts1:
line2 = nextline2
print line1 + "," + line2,

p*****2
发帖数: 21240

来自主题: Programming版 - 对scala很失望 (转载)

object test {
def main(args: Array[String]): Unit = {
val s=readLine
val a=new Array[Int](s.length())
var i=0
var j=s.length-1
for(k <- 0 to s.length-1)
if(s(k)=='l')
{
a(j)=k+1
j-=1
}
else
{
a(i)=k+1
i+=1
}
a.foreach(println)
}
}
void run() throws Exception
{
Scanner in = new Scanner(System.in);
out = new PrintWriter(System.out);

... 阅读全帖

r*********r
发帖数: 3195

来自主题: Programming版 - 问一个python问题

for lines in f:
txt = f.readline()

f**f
发帖数: 30

来自主题: Programming版 - 问一个python问题

for 里边的lines 不是已经是每一行的string了吗，可以直接slice这个lines吧，为什
么还要读行f.readline?

d********g
发帖数: 10550

来自主题: Programming版 - 问一个python问题

import os
import sys
path = os.getcwd()
input_file = os.path.join(path, 'raw_files', 'JAN 2013
FLVERTEXFLVertexFLVertex.txt')
output_file = os.path.join(path, 'temp', 'LatLon.csv')
with open(input_file, 'r') as fi:
with open(output_file, 'w') as fo:
output_file.write('ID,LAT,LON\n')
while True:
line = f.readline()
if not line:
break
id = line[0:6]
lat = line[6:16]
lon = line[16:27]
fo.writ... 阅读全帖

c********l
发帖数: 8138

来自主题: Programming版 - Python没有for loop

好的，多谢！！！
小弟这里有一些网上下载下来的srt字幕文件，
这些字幕文件在里面不知道为什么加入了多余的回车换行，导致看起来十分吃力
我想把多余的换行去掉，保证每组字幕显示只出现在单行
.srt文件的定义：
每组字幕在源文件中占据N行：
第一行是index
第二行是两个时间，中间用“-->”连接
第三行到第N-1行是字幕
第N行是空行
在java下，源文件可以被换行split成一个数组
然后用for (int i=0; i 因为在读前面的时候，后面哪一行“即第N行”才是空行中，N是未知
所以只能先读
读到空行之后，游标i可以回滚
用python，小弟水平不佳，只能下面这样了。
你看看有什么改进的空间没？
===================================================
'''
SrtMerger.py
@author: coupondeal
'''
import re
import os
base_dir = r"C:\Users\coupondeal\Desktop\srts"
dfList = [os.pat... 阅读全帖

D**u
发帖数: 288

来自主题: Programming版 - 很想了解的一个C#疑问

using System;
using System.Collections.Generic;
using System.Text;
namespace _000_TEST1
{
class A
{
public static int x = 5;
public int changex()
{
x = 4;
return x;
}
}
class Program
{
static void Main(string[] args)
{
var a = new A();
//Console.WriteLine(a.changex());
a.changex();
Console.WriteLine(A.x);
Console.ReadLine();
}
}
}
两个output 结... 阅读全帖

c*****t
发帖数: 1879

来自主题: Programming版 - Linux loading dynamic library problem

I wanted to add readline support to a command line app, but this program
could be run on machine without both libreadline and libncurses installed.
libreadline depends on libncurses to work.
If I do a dynamic link with these two libraries, the code would not run
on machines without either installed.
If I do dlopen on libreadline, it gave me error since it could not resolve
some global variables only found in libncurses.
Any ideas?

c*****t
发帖数: 1879

来自主题: Programming版 - Linux loading dynamic library problem

The problem is, some machines do not have libreadline and libncurses
installed in the first place.
So I would like to switch to defaults fget routine instead of calling
readline if the target machine does not have either installed.

w***g
发帖数: 5958

来自主题: Programming版 - Linux loading dynamic library problem

最好用static link. Linux版本太多, 如果想只deliver binary, 一要找一个老版本
的kernel, 二要static link所有的library. readline这种东西自己编译一个static版
本就可以了. 我最近在做的一个事情才扯淡. 对方要一个.so的binary. 但是
dependency一大堆, 结果是把所有要用到的library全都static link到这个.so中. 但
是这个.so本身又需要能被动态链接, 结果大部分的library还需要用-fPIC重新编译.
做完之后我很惊异于gnu这套toolchain的flexibility.

i***r
发帖数: 1035

来自主题: Programming版 - 巨大的文件怎么transpose？（python）

代码：
import sys
pop=98
def ped(genotype):
if genotype=='00':
ped='1 1 '
elif genotype=='01':
ped='1 2 '
elif genotype=='10':
ped='2 1 '
elif genotype=='11':
ped='2 2 '
else:
ped='0 0 '
return ped
def write_ped(filename,out):
fn=open(filename,'r')
fn_ped=open(out+'.ped','w')
fn_map=open(out+'.map','w')
modern_human=range(9,93) # 15+69
for ind in modern_human:
ind_genotype=''
fn.seek(0,0)
for line in fn.readlines():
lis=line[:-1].split("\t... 阅读全帖

f********o
发帖数: 1163

来自主题: Programming版 - 在线问一个qsub的问题。

我要qsub一个job到cluster去run，
qsub的是一个python code
在python code里调用了shell命令，os.popen('command1 >& output1; ps').
readlines()
然后我发现，虽然command1已经在运行了，得到的结果里依然没有command1，也就是说
ps没有探测到这个shell命令。
但返回的结果却有这个python的文件名。比方说temp.py
有人知道怎么破吗？有没有办法能在这个python里查看现在已经调用了几个类似于
command1的命令？
PS. 只要不qsub，这个python就可以运行。ps可以探测到command1.

f*****a
发帖数: 156

来自主题: Programming版 - Python和C++求助

编程水平不行，用Python的readline和C++的getline写的code慢死了，求高效算法。
问题如下：
两个输入文件，文件1是fastq格式，几千万行，每行最多100个字符
（每4行是一个序列的信息，其中的第2行是序列本身）:
@SEQ_ID1
GATTTGGGGTTCAAAGCAGTATCGATCAAATAGTAAATCCATTTGTTCAACTCACAGTTT
+
!''*((((***+))%%%++)(%%%%).1***-+*''))**55CCF>>>>>>CCCCCCC65
@SEQ_ID2
AATTTGGGGTTCAAAGCAGTATCGATCAAATAGTAAATCCATTTGTTCAACTCACAGTTT
+
+''*((((***+))%%%++)(%%%%).1***-+*''))**55CCF>>>>>>CCCCCCC65
@SEQ_ID3
TAGGCGGGGTTCAAAGCAGTATCGATCAAATAGTAAATCCATTTGTTCAACTCACAGTTT
+
C''F((((***+))%%%++)(%%%%).1***-+*''))**55... 阅读全帖

o*******p
发帖数: 27

来自主题: Programming版 - Python和C++求助

如果长度不等，可以用10 (=15-6+1)个dictionary，每个对应相对的长度：
ds = []
for i in range(10): ds.append({})
for line in open('file2.txt').readlines():
name, seq = line.strip().split()
length = len(seq)
ds[length - 6][seq] = 0
这样第一个文件的每一个序列需要与ds的每一个dictionary相比，对应不同的长度：
for seq in seqs: #省略了FASTQ reading
for i in range(10):
prefix = seq[6 + i]
if prefix in ds[i]:
ds[i] += 0
这样比直接比较应该快很多。

p*******e
发帖数: 186

来自主题: Programming版 - 这里人多，请问Java如何读取需要登录的网页的内容 (转载)

【以下文字转载自 JobHunting 讨论区】
发信人: pulselite (oOOo), 信区: JobHunting
标题: 这里人多，请问Java如何读取需要登录的网页的内容
发信站: BBS 未名空间站 (Wed Jan 1 12:52:21 2014, 美东)
我需要登录一个网站，输入用户名和密码，然后下载登录后的网页内容。请问Java如何
能做到？
我在网上找到下面一段代码，但好像不工作，不知道什么原因。版主请手下留情，这里
高手多。我刚学Java。
import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.net.Authenticator;
import java.net.MalformedURLException;
import java.net.PasswordAuthentication;
import java.net.URL;

publi... 阅读全帖

w*s
发帖数: 7227

来自主题: Programming版 - python urlopen(), how to go back to the beginning after readlines()

一个字：牛！

p*a
发帖数: 592

来自主题: Programming版 - 一个dot net浮点运算的问题

我在visualstudio 2013， 2012,2010里测过了，结果都是一样的，程序如下，
class Program
{
static void Main(string[] args)
{
Console.WriteLine("12.6 * 0.11985 tt= {0:F18}", 12.6 * 0.11985);
Console.WriteLine("float(12.6 * 0.11985) t= {0:F18}", (float)(12
.6 * 0.11985));
Console.WriteLine("12.6f * 0.11985 t= {0:F18}", 12.6f * 0.11985);
Console.WriteLine("float(12.6f * 0.11985) = {0:F18}", (float)(
12.6f * 0.11985));
Console.WriteLine("12.6 * ... 阅读全帖

b*********s
发帖数: 115

来自主题: Programming版 - Linux下incrementally地读一个正在被写的file

python的话用file的readline函数

f**********d
发帖数: 4960

来自主题: Programming版 - python读入数据的问题

需要用python从stdin读入数据。
要求逐行读入，
但是这里行之间的分隔符不是'\n'，
而是自定义的，比如'%^%'这样的特定字符串。
那么python如何做这个？
readlines()默认行间分割符是'\n'.
thx

w***g
发帖数: 5958

来自主题: Programming版 - 从心底讨厌scala

我随便给你几段程序。不是多敲一两个字母的问题，而是多敲几倍字母的问题。
敲的同时脑子还需要处理各种和程序逻辑无关的exception handling问题。
(我这个比较的前提是程序用来做数据处理，尝试新算法，最终90%的代码都会
被扔掉。）
java:
try (BufferedReader reader = Files.newBufferedReader(file, charset)) {
String line = null;
while ((line = reader.readLine()) != null) {
System.out.println(line);
}
} catch (IOException x) {
System.err.format("IOException: %s%n", x);
}
scala:
for(line <- Source.fromPath("myfile.txt").getLines())
println(line)
python:
for line in open("myfile.txt... 阅读全帖

q*c
发帖数: 9453

来自主题: Programming版 - 从心底讨厌scala

这个例子没啥意义
1，你java handle exception scala 就没有。你 java 不 handle 不就行了？
2. 有的是 lib 把一个文件一下读进来称为 string[].
String[] lines = new FileArrayProvider().readLines("filename");
for(String s : lines) println(s)...
结果差别很小。
而且主要的时间是思考，找数据，找 dependency 等，这几行程序算啥。

g*****g
发帖数: 34805

来自主题: Programming版 - 从心底讨厌scala

Java无数类库，比如guava。跟你这下面不就差不多嘛。IOException在function上扔
掉就是。
for(String line : Files.readLines(new File("myTxt"), charset))
System.out.println(line);

p*******t
发帖数: 501

来自主题: Programming版 - 问一个用R抓网上数据，抓下来的和网页不一致

新手尝试用R抓网上数据，但是发现抓下来的和网页不一致。用最简单的readLines的话
是可以一致的，但是如果用geturl，抓下来的source code和原始网站的source code就
不一样。这是为什么？
我在尝试抓这个网页。
http://bbs.9game.cn/forum-1534-1.html
谢谢！

p***o
发帖数: 1252

来自主题: Programming版 - 一种新型的推测编程

这种活随便找个脚本语言就好了，shell有head -n，python有readlines。

发帖数: 1

来自主题: Programming版 - Re: 请教 Python 如何去掉json文件里数字上的双引号？

文件是json格式，这样写结果还是有问题，应该怎么改？
with open(inputFileName,'rb') as infile:
json_raw=infile.readlines()
json_object=json.loads(json_raw)

for info in json_object:
for attribute, value in info.iteritems():
if(eval(value).isdigit()):
value.replace('"','')

发帖数: 1

来自主题: Programming版 - Re: 请教 Python 如何去掉json文件里数字上的双引号？

下面这个方法试了试，也不行
i=0
with open(inputFileName,'rb') as infile, open(outputFileName,'wb') as
outfile:
for r in infile.readlines():
if i/2==1:
for var in r.values():
print r.values()
if eval(var).isdigit():
list(var).replace('"','')
i=i+1

h****i
发帖数: 94

来自主题: Unix版 - 有人玩过Minix吗？

readline library

c*****t
发帖数: 1879

来自主题: Unix版 - 有人玩过Minix吗？

Just google readline.

b*******s
发帖数: 5216

来自主题: AnthroLing版 - a script

#!/usr/bin/env /usr/bin/python3
import sys, os, argparse, shutil
templates_dir = os.path.expanduser('~') + '/templates/'
cwd = os.getcwd() + '/'
py_templates = ['empty.py']
cpp_templates = ['empty.h','empty.cpp']
test_templates = ['Makefile','main.cpp','helper.h','Test.cpp']
perf_templates = ['perf.h']
main_templates = ['entry.cpp']
make_templates = ['CMakeLists.txt']

def copy_templates(templates,name,affected,to_be_replaced,to_replace):
for file in templates:
if not os.pat... 阅读全帖

b*******s
发帖数: 5216

来自主题: AnthroLing版 - a script

e*****t
发帖数: 642

来自主题: Biology版 - python 2.7 里面没有sys.stdin.readlines()

为虾米？这个命令很常用的呀？

K****n
发帖数: 5970

来自主题: Biology版 - python 2.7 里面没有sys.stdin.readlines()

听说现在都用3呀

f*******a
发帖数: 671

来自主题: Biology版 - 有谁谈谈从零开始学NGS数据分析都需要具备什么知识？

哈哈，你说的这些我都不知道。从零开始学这么多挺厉害的。我们主要做differential
expression. 据说Facility会把mapping 和 reads都给我门。所以我们主要是后期的
分析。因为之前我们一直是microarray, sequencing对我们来说太陌生。

greb
readlines

j*p
发帖数: 411

来自主题: Biology版 - 有谁谈谈从零开始学NGS数据分析都需要具备什么知识？

very well said.

greb
readlines

s***o
发帖数: 11

来自主题: Biology版 - 有谁谈谈从零开始学NGS数据分析都需要具备什么知识？

写的真好。
我在国内学过一段生物信息，至少自己动手算过smith-waterman alighment，呵呵。
但工作后自己生物信息用的少了，很多工作交给公司或者做计算的学生去做了。然后现
在来美国一个作bioinformatics的实验室从头开始学习transcriptome analysis，才做
了20多天，依然一头雾水，有你分享的这段经历，有信心多了。
而且和你有相同的体会，的确需要一个人，既懂一些计算，也懂一些生物，这样才能更
好更深刻的理解你所分析的东西。dry lab和wet lab结合的再好的地方，两个人毕竟是
两个人。
我也是抱着这样的目的，三十多了，还跑过米国学习生物信息。以前的项目看不懂公司
的分析结果，或者说只看懂了他们给我们看的哪些东西，不知道具体处理细节，结果找
出来SNV验证结果很不理想。

greb
readlines

n******7
发帖数: 12463

来自主题: Biology版 - 有谁谈谈从零开始学NGS数据分析都需要具备什么知识？

写得真好，应该M

greb
readlines

u**********d
发帖数: 573

来自主题: Biology版 - 有谁谈谈从零开始学NGS数据分析都需要具备什么知识？

赞！

greb
readlines

G***y
发帖数: 1082

来自主题: Biology版 - 有谁谈谈从零开始学NGS数据分析都需要具备什么知识？

Great Post. Thanks for sharing.

greb
readlines

y*******5
发帖数: 37

来自主题: Biology版 - 有谁谈谈从零开始学NGS数据分析都需要具备什么知识？

刚开始接触NGS确实感谢颇多，说一下我对生物信息学的感想吧，n年前最最开始的时候
觉得不过是用用电脑，查查文献，四五年前正儿八经上了一门课，觉得类似于英语课，
净得看英文网页，数据库，用些乱七八糟的小程序，跟自己的实验也联系不紧密，感觉
就是个花里胡哨的东西。上学期学了个perl编程，这才发现生物信息要学的东西还非常
多。
比如受制于I/O的速度，我只能用数据库Mysql来存取数据，为了更好的展示计算结果，
还得学习R语言，做个统计。DNA序列分析涉及到很多算法、公式，我还得系统的学习概
率论，数理统计，然后用MetLab软件来实现。有时候为了学习别人的算法，我还得从零
学起C++语言。其实语言的东西还好说，学了一种其他很多种学起来就容易点。更难得
还是纯计算机科学，最难得就是我一直以来的克星-数学了。
在计算机科学上涉及到了数据库管理，数据挖掘。举个当前的例子吧，现在要做个系统
进化，所以得确定基因序列，得排除假基因。因为假基因的特征实在太多，现有的
genome annotation还是会掺杂很多假基因，所以我得学着文献里的样子自己排除，但
机器不是人，得一步步教它怎么排除，这就涉... 阅读全帖

y*******5
发帖数: 37

来自主题: Biology版 - 有谁谈谈从零开始学NGS数据分析都需要具备什么知识？

刚接触NGS确实感谢颇多，说一下我对生物信息学的感想吧，n年前最最开始的时候觉得
不过是用用电脑，查查文献，四五年前正儿八经上了一门课，觉得类似于英语课，净得
看英文网页，数据库，用些乱七八糟的小程序，跟自己的实验也联系不紧密，感觉就是
个花里胡哨的东西。上学期学了个perl编程，这才发现生物信息要学的东西还非常多。
比如受制于I/O的速度，我只能用数据库Mysql来存取数据，为了更好的展示计算结果，
还得学习R语言，做个统计。DNA序列分析涉及到很多算法、公式，我还得系统的学习概
率论，数理统计，然后用MetLab软件来实现。有时候为了学习别人的算法，我还得从零
学起C++语言。其实语言的东西还好说，学了一种其他很多种学起来就容易点。更难得
还是纯计算机科学，最难得就是我一直以来的克星-数学了。
在计算机科学上涉及到了数据库管理，数据挖掘。举个当前的例子吧，现在要做个系统
进化，所以得确定基因序列，得排除假基因。因为假基因的特征实在太多，现有的
genome annotation还是会掺杂很多假基因，所以我得学着文献里的样子自己排除，但
机器不是人，得一步步教它怎么排除，这就涉及到m... 阅读全帖

y***i
发帖数: 11639

来自主题: Biology版 - 有谁谈谈从零开始学NGS数据分析都需要具备什么知识？

太太太有用了。多谢这位。

greb
readlines

c****1
发帖数: 1095

来自主题: Biology版 - 有谁谈谈从零开始学NGS数据分析都需要具备什么知识？

这个要mark下。多谢分享！

greb
readlines

z**********i
发帖数: 12276

来自主题: Statistics版 - 一个R的问题

我试着导入一个文件：GSM170754.gpr
library(marray)
filenames <- c("GSM170754.gpr")
data <-read.GenePix(filenames)
save(data, 'data_raw.RData')
当读入DATA的时候报错:
Reading ... GSM170754.gpr
Error in if (skip > 0) readLines(file, skip) :
missing value where TRUE/FALSE needed
多谢指教!!

s*********e
发帖数: 1051

来自主题: Statistics版 - 有没有什么R PACKAGE 能把web上的文本抓下来?

steal from page 23 in "data manangment with R"
> rpage = url(’http://www.r-project.org/main.shtml’,’r’)
> while(1){
+ l = readLines(rpage,1)
+ if(length(l) == 0)break;
+ if(regexpr(’has been released’,l) > -1){
+ ver = sub(’ + print(gsub(’^ *’,’’,ver))
+ break
+ }
+ }

t****g
发帖数: 715

来自主题: Statistics版 - 新手求教：linux下怎么跑R文件？

ps:
PID TTY TIME CMD
28865 pts/22 00:00:00 tcsh
28900 pts/22 00:00:00 ps
ps aux|grep zzzzz (suppose it's my id)
zzzzz 28515 0.0 0.0 63860 1168 ? S 21:43 0:00 sh /gpfs/
runtime/lib64/R/bin/Rcmd BATCH finite_test.R
zzzzz 28520 99.9 0.3 279752 183668 ? R 21:43 18:50 /gpfs/
runtime/lib64/R/bin/exec/R -f finite_test.R --restore --save --no-readline
zzzzz 28594 0.0 0.0 78860 1104 ? Ss 21:49 0:00 SCREEN
zzzzz 28595 0.0 0.0 64708 1

D*******a
发帖数: 207

来自主题: Statistics版 - 填充缺失值问题请教 (SAS, R, 所用软件不限)

Use python; it is fast and easy to understand.
Save the following program as "abc.py", than run it as:
python abc.py < oldfinename > outputfilename
import sys
header = sys.stdin.readline()
print header,
pre_id = ""
pre_value = ""
for line in sys.stdin:
lineSplit = line.rstrip("\s").split()
if lineSplit[1] == "NA":
if lineSplit[0] == pre_id:
lineSplit[1] = pre_value;
else:
lineSplit[1] = "0"
pre_id = lineSplit[0]
pre_value = lineSplit[1]

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

topics

未名新帖统计// 7月16日

历史上的今天