p**h 发帖数: 99 | 1 【 以下文字转载自 Linux 讨论区 】
【 原文由 penh 所发表 】
假设我有2目录, 里面的相同文件名的内容应该是完全相同的.
比如:
在dir1中, 我有: file1 file2 file3...
在dir2中, 我有: file1 file2 file3...
dir1/file1 应该和 dir2/file1 完全相同.
dir1/file2 应该和 dir2/file2 完全相同.
dir1/file3 应该和 dir2/file3 完全相同.
...
如何进行比较以确认这一点? 当然我可以用diff手动地一个个地比较.
但有没有更cool的办法? thanks. |
|
f**********t 发帖数: 1001 | 2 抛砖,我的2 cent.
基本思路:用hash和MD5。
1. 把大文件file1里的每一行做MD5。重复行的MD5会相同。把所有(line, MD5 value)
写入另一个文件file2。
2. 可能另一个文件file2特别大,不能一次读入内存。这时可以把它分成若干个小的。
比如我们想把它分成8个小的,则根据MD5 value的后三位,分到第0,1,2,。。。7个
文件。这时重复的行一定在相同的小文件中。
3. 这8个文件都可以一次读入内存。对于每个文件:
count重复的行,可用map/hashmap数据结构。(8个文件中,重复的行一定不会跨越
两个文件)。把所有重复的行写入文件file3
4. 根据file1和file3,去掉所有重复的行。把不重复的写入fileDst。
呼唤更好的解法 =) |
|
|
q******n 发帖数: 66 | 4 Is this what you are trying to do?
-bash-3.2$ cat file1
1_1 1_2 1_3 1_4
-bash-3.2$ cat file2
2_1 2_2 2_3 2_4
-bash-3.2$ cut -f3,4 file2 > file3
-bash-3.2$ paste file1 file3 > file4
-bash-3.2$ cat file4
1_1 1_2 1_3 1_4 2_3 2_4 |
|
c****m 发帖数: 855 | 5 Target: file:/C:/Users/kevin/Desktop/html/file3.html
I/O Error: import file:/C:/Users/kevin/Desktop/html/file3.html: Operation
not permitted
说这个。。这个是什么意思 |
|
A******a 发帖数: 61 | 6 Process p = Runtime.getRuntime("cat /users/test/file1.txt /users/test/file2.
txt > /users/test/file3.txt").exec;
It reports an error like this:
cat: /users/test/file3.txt: No such file or directory
it seems it is the redirecting ">" symbol makes problem.
can anyone help here?! thanks. |
|
p*****a 发帖数: 1152 | 7 http://linuxcommando.blogspot.com/2008/09/how-to-find-and-delete-all-hard-links.html
Deleting a file is deceptively simple. You can simply use the rm command
like this.
$ rm file1
However, if the file has one or more hard links to it, life gets more
interesting. You need to seek and destroy all hard links to the file.
A hard link is essentially another name for a file. Hard links to file1 can
be created as follows:
$ ln file1 file2
$ ln file1 tmp/file3
file2 and file3 become another name of file |
|
F****3 发帖数: 1504 | 8 请问怎么看真实进程?我在用gzip来zip我的一个目录架的时候,其他用户能够看到
gzip正在处理那个文件吗?比如
gzip abc_folder
里面有
file1
file2
file3
别人能看到file1,file2, file3的文件名吗?
谢谢! |
|
O******e 发帖数: 734 | 9 Maybe this is more like what you want:
$ tar tf p1.tar
file1
file2
$ tar tf p2.tar
file3
file4
$ tar Af p.tar p1.tar
$ tar Af p.tar p2.tar
$ tar tf p.tar
file1
file2
file3
file4
It seems that the "tar Af" command needs to be issued once
for each of p1 and p2. I didn't play around with the gzip
part; you can try it on your own. |
|
|
e****e 发帖数: 179 | 11 【 以下文字转载自 Linux 讨论区 】
发信人: engine (boxing cat), 信区: Linux
标 题: help on replacing text in a file
发信站: BBS 未名空间站 (Wed Oct 31 11:42:35 2007)
I would like to replace string 1 with string 2 in file3.dat, here is what I
did:
#!/usr/bin/perl
@inputfile= ("string1");
@outputfile=("string2");
@attfile=("file3.dat");
$mytempfile=$inputfile[0];
$youtempfile=$outputfile[0];
$hisfile=$attfile[0];
perl -pi -e 's/$mytempfile/$youtempfile/' $hisfile;
The program reports an error:
Scalar found where operator ex |
|
a***e 发帖数: 1010 | 12 用 perl 很简单的
建一个 %flag
建一个 %temp
(1) 先打开file2, 按行读入,用第一列做标记, 赋值为 1 ($flag{$1} =1), 并且把整
行赋值到 $temp{$1} = $line
(2) 再打开file1, 按行读入,先检验第一列的标记是否为 1 ($flag{$1} ==1),
如果不是,把file1的 行写到新文件file3;
如果标记是 1, 把file1的 行写到新文件file3, 把$temp{$1}夜写到这一行里 。 |
|
d******a 发帖数: 32122 | 13 【 以下文字转载自 PDA 讨论区 】
发信人: weidong (伊拉克学习小组副组长), 信区: PDA
标 题: Re: 被SKYDRIVE震精了.
发信站: BBS 未名空间站 (Sun Mar 3 15:48:18 2013, 美东)
映射表你可以看看,
Due to the limitations of the supported zip file format, the following file(
s) had to be renamed.
Original File Name -> New File Name
1.电子书目录/文件索引.txt -> 1/File1.txt
婚恋。两性/B/性社会学.epub -> 2/B/File2.epub
婚恋。两性/B/魔鬼搭讪学 1.epub -> 2/B/File3.epub
婚恋。两性/B/男性保健.epub -> 2/B/File4.epub
婚恋。两性/B/魔鬼搭讪学.epub -> 2/B/File5.epub
婚恋。两性/B/把妹达人.epub -> 2/B/File6.epub
婚恋。两性/B/骄傲风趣... 阅读全帖 |
|
o***s 发帖数: 42149 | 14 酒井法子
据日本媒体报道,去年11月结束缓刑,之后凭借主演舞台剧复出的酒井法子时隔五年主演日剧《黑色报告书男与女事件FILE3 误解》,日前她在东京出席了该剧制作发布会。不过据《周刊实话》杂志报道称,她很难恢复人气,已经被AV制作方列入交涉名单,报酬以亿为单位。
据一位电视台相关人称:“这部剧以《周刊新潮》的知名企划‘黑色报告书’为基础改编,酒井法子在剧中饰演女编辑,与石黑贤饰演的主人公编辑一起采访各种犯罪事件。
”回忆第一天拍摄,酒井法子苦笑着说:“我自己也没想到会那么紧张,NG了好多次。”这个角色设定和酒井法子很相似,也曾经历过重大挫折又重新站起来,她觉得能得到这份工作是缘分,也很感激制作方。
据圈内相关人士称:“虽然酒井法子本人对女星事业干劲十足,可说实话她复出后也并不轻松吧,她毕竟是偶像艺人出身,演技普普通通,表情也很单一,而且给人留下吸毒的印象不会那么容易改变,恐怕不可能再像以前一样受欢迎。”
据《周刊实话》杂志报道称,对于现在的酒井法子来说,拍摄露毛写真也是一个办法,但是想真正一举成功还是AV最有效。据一位艺能记者透露:“要想一举成名,还是AV最有效,而且也有小向美奈子这种... 阅读全帖 |
|
f*********9 发帖数: 184 | 15 今天给uscis打电话,什么也不说,让30天以后再打。。。
昨天收到了recipt notice,呵呵,已经是file3周之后了。是邮局的投递错了。希望
approvl notice不要出现这样的情况,赶快收到。
是不是uscis没有纸了??? |
|
y******0 发帖数: 8807 | 16 第一个例子可以说明只要LC有效,就可以一直file multiple 140s.
第二个例子可以说明2类的条件可以file3类的140。
解释啥啊?啥也不用解释,就是amend to different classification. |
|
|
b********k 发帖数: 5 | 18 好的。多谢。直接file3类,将来还能relink回2类吗 |
|
s***k 发帖数: 23 | 19 【 以下文字转载自 Programming 讨论区,原文如下 】
发信人: stock (Microsoft is dead), 信区: Programming
标 题: Perl for programmers(3): file operation
发信站: The unknown SPACE (Tue May 23 16:00:57 2000) WWW-POST
open(FILE1, "filename");#read from an existing file
open(FILE2, "
open(FILE3, ">filename");#create and write to a file
open(FILE4, ">>filename");#append an existing file
open(FILE5, "|outputpipe");#setup an output filter
open(FILE6, "inputpipe|");#read from an existing file |
|
h***a 发帖数: 358 | 20 我在access2000 中建立了一个tree view
+....folder1
-.....folder2
......file1
......file2
....folder3
+表示有东西,可以expand, -表示已经expand 了, 没有child 的话,
就没有任何加+,-好。
我现在要求得到这样的结果。
+, - 继续要所表达的意思。 但是在根目录下, 可以区分是不同的level的node.
列如, 根目录下可以有file, 有folder, 但是我不知道怎么用符号或者 image把他们给
区分开
+....folder1
-.....folder2
......file1
......file2
....folder3
....file3
就象建立folder 和file 一样。 一看就知道是文件夹还是文件, 是空文件夹,还是有东
西
请问有人知道access 里面怎么做吗? 用access 的VBA也行. 多谢 |
|
u**d 发帖数: 211 | 21 我有几个文件,有些是 data 直接 bulk load,有些是 script
我是想能把几个任务一起搞,类似下面的格式
bulk load file1
bulk load file2
run script
bulk load file3
一个方案是把 bulk insert 命令贴在 script 的里面
不过 script 是外部模块独立生成的
每次运行就要重新 merge 一下
而且合在一起 pipeline 里的每一步就显得不是很明确
别人读起来不大容易懂 |
|
r*****r 发帖数: 397 | 22 I have a directory with hundreds of *.doc files,and I want to search a word "t
otal", if the total value is greater than 50, then I want to copy this file to
a new directory,and change the name sequentially to file001.doc,file002.doc .
...sth like that.
So, when I grep "total" ,I got
file1.doc
total: 12
file2.doc
total: 13
file3.doc
total: 56
...
#! /bin/tcsh
foreach wordfile (*.doc)
grep total $wordfile | awk '($2 > 50) {com = sprintf("cp " $wordfile "
../new_dir");print c |
|
a****l 发帖数: 8211 | 23 我现在有一堆的C程序,需要知道其中宏定义的数值.比如:
file1: #define pig 1
file2: #define sheep 2
file3: #define dog 5
file4: #define total dog+sheep-pig
需要用一个比如perl的脚本程序扫描过所有的文件,然后能输出total=6.问题是显然这
个计算的方法不是固定的,所以脚本程序基本上需要按照C的规定展开宏定义,找到各词
语对应的数值,再计算出最终的数字.
有谁知道perl能不能做这样的工作?如果不是perl,有什么东西能做这样的事?谢谢! |
|
g*********r 发帖数: 124 | 24 直接用
\bibliography{file1.bib, file2.bib ,file3.bib}
就可以了 |
|
n******h 发帖数: 97 | 25 你是说在tex文件里面用\bibliography{file1.bib, file2.bib ,file3.bib}么?
这样的话我必须把需要用得reference所有的bib文件名都记住。
主要是我想偷懒,每篇文章只要\bibliography{allreference.bib}就可以了。
然后再allreference.bib去引用不同的bib文件。这样我的bib库变化的话我
只用更新allreference就行乐。 |
|
c******r 发帖数: 38 | 26
paste file1 file2 > file3 ? |
|
w*****n 发帖数: 94 | 27 copy in dos can do that.
copy /b file1 + file2 file3 |
|
o******l 发帖数: 828 | 28 A guy sent me a tar file, but he tar those files with absolute path;
for example, I got below when using tar tvf thetarfile.tar:
-rw-r--r-- 3433 Oct 17 10:06 2002 /home/dude/file1.cpp
-rw-r--r-- 1007 Oct 17 10:06 2002 /home/dude/file2.cpp
-rw-r--r-- 8235 Oct 17 10:06 2002 /home/dude/file3.cpp
Is it possible for me to extract by tar? Since the guy used absolute path,
"tar xvf..." can't succeed as I have no permission to create directories under
home. Is there a workaround? Thanks. |
|
g***y 发帖数: 11 | 29 I know it is easy to append to end of file, just cat file1 file2>file3.
Actually, I want to append one file into another file in given position (in
bytes). How can I do it?
Thanks. |
|
c**t 发帖数: 2744 | 30 man split
I know it is easy to append to end of file, just cat file1 file2>file3.
Actually, I want to append one file into another file in given position (in
bytes). How can I do it?
Thanks. |
|
i********e 发帖数: 16 | 31
Use copy file1+file2+file3+... outputfile |
|
d******9 发帖数: 404 | 32 This is a special case: all the dataset names are arranged in order, like
File1, File2, File3.....File10000.
What if they are not...? |
|
a********a 发帖数: 346 | 33 It is easy. Try
Proc sql;
create table file3 as
select a.id, a.name
from file2 as a
where a.id in (select id from file1);
quit; |
|