由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Programming版 - 请问pdf还是html更容易text processing?
相关主题
问一个python multiprocessing问题怎么样用 C Parse HTML?
请问const myClass &src 和myClass const &src有什么区别?HTML 的入门书?
in Java, how can we trigger an event when click on a Text问一个HTML的傻问题。。。。
[转载] Google desktop中HTML文件的thumbnail是怎么搞的?[合集] Help: realize a simple function in HTML
[转载] 在CGI程序中有何好方法返回HTML是否有工具生成HTML/JS/CSS?
问一个paste as html得 control (转载)请教一个javascript的问题
PHP或HTML:如何实现一个点击后同时更新两个frame的内容?问个HTML DOM JavaScript相关的问题
如何编写HTML email newsletter 谢谢Head First HTML and CSS, 2nd Edition
相关话题的讨论汇总
话题: html话题: pdf话题: text话题: 请问话题: processing
进入Programming版参与讨论
1 (共1页)
F****3
发帖数: 1504
1
同样的文档,但是可以提供两种不同的格式,html或者pdf。请问如果做textual
analysis的话,比如把文字和dictionary match那种格式更容易一些呢?谢谢!
c****e
发帖数: 1453
2
HTML.
d****n
发帖数: 1637
3
+1
for one scenario, you need to change/modify the input text file for testing
your script, but PDF is very hard to make a quick change(unless you use
pdf2tex).
HTML is very flexible using any text editor to make a change.

【在 c****e 的大作中提到】
: HTML.
x****u
发帖数: 44466
4
用某些lex程序搞出来的pdf就是bs。

【在 F****3 的大作中提到】
: 同样的文档,但是可以提供两种不同的格式,html或者pdf。请问如果做textual
: analysis的话,比如把文字和dictionary match那种格式更容易一些呢?谢谢!

F****3
发帖数: 1504
5
太好了谢谢啊!
y***s
发帖数: 23
6
HTML
x****d
发帖数: 1766
7
same, use tika
1 (共1页)
进入Programming版参与讨论
相关主题
Head First HTML and CSS, 2nd Edition[转载] 在CGI程序中有何好方法返回HTML
should i change to ruby on rails?问一个paste as html得 control (转载)
是react几种代码混合好还是angular分开好PHP或HTML:如何实现一个点击后同时更新两个frame的内容?
html 5 or angular storage如何编写HTML email newsletter 谢谢
问一个python multiprocessing问题怎么样用 C Parse HTML?
请问const myClass &src 和myClass const &src有什么区别?HTML 的入门书?
in Java, how can we trigger an event when click on a Text问一个HTML的傻问题。。。。
[转载] Google desktop中HTML文件的thumbnail是怎么搞的?[合集] Help: realize a simple function in HTML
相关话题的讨论汇总
话题: html话题: pdf话题: text话题: 请问话题: processing