f**********d 发帖数: 4960 | 1 需要用python从stdin读入数据。
要求逐行读入,
但是这里行之间的分隔符不是'\n',
而是自定义的,比如'%^%'这样的特定字符串。
那么python如何做这个?
readlines()默认行间分割符是'\n'.
thx |
n******7 发帖数: 12463 | |
f**********d 发帖数: 4960 | 3 sys.stdin.split(sep)这样不行啊!
【在 n******7 的大作中提到】 : split一下就好了
|
n******7 发帖数: 12463 | 4 我是说你读入之后再split一下
【在 f**********d 的大作中提到】 : sys.stdin.split(sep)这样不行啊!
|
f**********d 发帖数: 4960 | 5 这文件100多个G,
不能整体读到内存里,像read()那样。
need memory effecient way.
【在 n******7 的大作中提到】 : 我是说你读入之后再split一下
|
n******7 发帖数: 12463 | 6 试试这样?
cat file | sed -e 's/%,%/\n/g' | python xxx.py
【在 f**********d 的大作中提到】 : 这文件100多个G, : 不能整体读到内存里,像read()那样。 : need memory effecient way.
|
f**********d 发帖数: 4960 | 7 是这样,这个文件的每行之间由"%\n%"这样的东西分隔,
但是每行内部有数量不等的回车"\n".
你这个sed是否是把"%^%"替换成"\n",那样会有多个回车,还是行不通。
I got it, sed can be a solution. thanks.
【在 n******7 的大作中提到】 : 试试这样? : cat file | sed -e 's/%,%/\n/g' | python xxx.py
|
c*******y 发帖数: 1630 | 8 http://stackoverflow.com/questions/19600475/how-to-read-records
【在 f**********d 的大作中提到】 : 需要用python从stdin读入数据。 : 要求逐行读入, : 但是这里行之间的分隔符不是'\n', : 而是自定义的,比如'%^%'这样的特定字符串。 : 那么python如何做这个? : readlines()默认行间分割符是'\n'. : thx
|
|