r*****9 发帖数: 75 | 1 我今天被面了一个start up的 intern,一个烙印面的我,英语一句也没听懂,整个过
程基本就是鸡同丫讲。 3分钟匆匆结束。
这个家伙随后给我发过来了一个问题(在电话里问过了,我实在听不懂),叫我给他回个
自己的想法.不过看了email后,我也是没懂,实在是惭愧。
他的问题原话:As discussed, please share your thoughts on integrating Quartz
from Apple (for PDFs) into the solution. I am interesting in getting your
view how this might help/affect the solution of automating the process.
大体背景介绍: 公司是一个做类似与text mining的工作,用lucene, 需要把pdf里面
的文本取出来。
我google了一下这个Quartz 是apple的 一个图形处理的引擎。
我想问得是,我这个东西怎么自动的提取pdf的文本呢 ?
我要有什么想法呢
知道板上牛人众多。
谢谢前辈... 阅读全帖 |
|
a****a 发帖数: 21 | 2 Is there anyone has experience with pdf online editing service? I want to
build a system that can let user dynamically edit graphics and text in the pdf
file? the pdf is retrieved from database, and the user can move, rescale,
modify both graphics and text.
Thanks for any suggestion or software recommendation! |
|
w*******e 发帖数: 285 | 3 我的机器要是从dvi->pdf直接来边距就没有问题,要是先dvi->ps,再ps->pdf,或者用
adobe distiller把ps转成pdf文件边距都有问题,上面的很小,下面的很大,大家知道
这个问题怎么解决吗? |
|
e*****r 发帖数: 379 | 4 Hi, guys,
How to fetch PDF files from a journal website automatically?
Most journals today tell you the link of PDF to the paper, and when you
click the link in web explorer, and then right click again for saving to
PDFs.
This is very time consuming! I wonder there must be a way to do it
automatically.
I have experience on vb et al, but not on Web programming
Thanks! |
|
K*****n 发帖数: 65 | 5 公司要关门,作为看守成员,现在比较闲。今天又拿到中意的Offer, 索性帮人帮到底
,post complete C# code, you need download open source ItextSharp at http://sourceforge.net/projects/itextsharp/ and add to your project reference.
using System;
using System.IO;
using iTextSharp.text;
using iTextSharp.text.pdf;
namespace ConvertPDF
{
static class Program
{
[STAThread]
static void Main()
{
string szSource = @"c:\BeanStalk.pdf"; //change
string szDest = @"c:\Test.pdf";
Con |
|
T****n 发帖数: 127 | 6 需要自己设计pdf表格,然后asp.net程序填data进入表格里面设计好的fields里面,请问
1. 什么软件设计制作pdf表比较方便
2. 有什么好的library可以给asp.net用来read pdf和往里面动态的填data得,比如拿
出一个人信息,往这个人信息登记表里面填
谢谢 |
|
l*s 发帖数: 783 | 7 ☆─────────────────────────────────────☆
kongzi (鸡龟骨滚羹) 于 (Thu Sep 8 14:25:05 2011, 美东) 提到:
flexcel,aspose
请问
☆─────────────────────────────────────☆
samleelyz (小蓝脸儿) 于 (Thu Sep 8 22:50:11 2011, 美东) 提到:
iTextSharp is pretty good.You can make PDF from anything (Word,etc) and
write code to input data to that form.
请问
☆─────────────────────────────────────☆
rodeo (rodeo) 于 (Wed Sep 21 10:16:15 2011, 美东) 提到:
制作PDF表格用Adobe Acrobat + Illustrator
library用Aspose,PDF4NET,这两个library我用过都不错... 阅读全帖 |
|
l*s 发帖数: 783 | 8 ☆─────────────────────────────────────☆
kongzi (鸡龟骨滚羹) 于 (Thu Sep 8 14:25:05 2011, 美东) 提到:
flexcel,aspose
请问
☆─────────────────────────────────────☆
samleelyz (小蓝脸儿) 于 (Thu Sep 8 22:50:11 2011, 美东) 提到:
iTextSharp is pretty good.You can make PDF from anything (Word,etc) and
write code to input data to that form.
请问
☆─────────────────────────────────────☆
rodeo (rodeo) 于 (Wed Sep 21 10:16:15 2011, 美东) 提到:
制作PDF表格用Adobe Acrobat + Illustrator
library用Aspose,PDF4NET,这两个library我用过都不错... 阅读全帖 |
|
c*********c 发帖数: 113 | 9 VS2010, 做的一个windows application
需要实现的一个功能是,把一个已经拿到的dataTable, 以PDF的形式保存到本地,用
的iTextSharp
一开始说我column的number不对,然后各种在网上找,然后改的面目全非以后又出现了
如题所示的错误。。。改疯了,求高手指点。。。
以下为代码:
public string ExportToPDF(DataTable dt, ReportEnums reportType, DateTime
fromDate, DateTime toDate)
{
//这句没关系
string pdfName = utls.GetFileNameandPath(reportType);
Document document = new Document();
MemoryStream inputPDF = new MemoryStream();
M... 阅读全帖 |
|
c*********c 发帖数: 113 | 10 VS2010, 做的一个windows application
需要实现的一个功能是,把一个已经拿到的dataTable, 以PDF的形式保存到本地,用
的iTextSharp
一开始说我column的number不对,然后各种在网上找,然后改的面目全非以后又出现了
如题所示的错误。。。改疯了,求高手指点。。。
以下为代码:
public string ExportToPDF(DataTable dt, ReportEnums reportType, DateTime
fromDate, DateTime toDate)
{
//这句没关系
string pdfName = utls.GetFileNameandPath(reportType);
Document document = new Document();
MemoryStream inputPDF = new MemoryStream();
M... 阅读全帖 |
|
M****7 发帖数: 13407 | 11 这边人多, 问个挺小白的问题:
对方让我从WORD转成PDF file, 并要求"must not have Adobe Document Protection
enabled, as this prevents us from processing the file".
那怎么个转法才能使对方能对我的PDF文件进行处理? 我自己怎样才能看自己转成的PDF
FILE是否符合对方的这一要求?
谢谢!! |
|
G**Y 发帖数: 33224 | 12 【 以下文字转载自 Apple 讨论区 】
发信人: acidia (acidia), 信区: Apple
标 题: Re: ipad确实stupid,上传个pdf还要那么麻烦? (转载)
发信站: BBS 未名空间站 (Mon Jun 6 01:20:42 2011, 美东)
你这是在显示自己智商低吗
首先,网上的pdf文件,直接用safari访问连接,就会问你是否用ibook打开
其次,stanza也能不花钱打开
再三perfectpdf lite版不花钱也能打开
再四,goodreader /perfectpdf能让你获得最佳的阅读体验,花点钱,值
我现在的pdf都是直接存在amazon cloud上,然后从ipad直接打开 |
|
b*****s 发帖数: 1124 | 13 【 以下文字转载自 SanFrancisco 讨论区 】
发信人: bigcats (大猫), 信区: SanFrancisco
标 题: anyone can recommend a free PDF printer driver?
发信站: BBS 未名空间站 (Fri Dec 2 21:21:58 2011, 美东)
when printing, I want to an option to print as PDF file instead of actually
printing on a printer.
I have Acrobat 8, supposely it come with a free PDF printer, but doesn't
work on my Win7 x64 machine.
Thanks. |
|
t******n 发帖数: 238 | 14 【 以下文字转载自 Software 讨论区 】
发信人: thisnoon (noon), 信区: Software
标 题: 求PDF解密
发信站: BBS 未名空间站 (Fri Aug 5 13:51:24 2011, 美东)
哪位高手帮帮忙,我已经用了PDF Password Remover,PDF Unlocker都没成功 |
|
s*******g 发帖数: 59 | 15 Is it feasible to interface a Scanner with Pdf format by customized
application? I know that Acrobat 5.0 can scan documents directly
into pdf file. I wonder whether there are any tools that I can
use to develop my own interface, so that after I scan a set of
documents, it can automatically save pdf format to certain location?
Thanks. |
|
I*******o 发帖数: 53 | 16 需求是这样的:
input: XML data, PDF template (generated by Designer)
output: PDF file (template filled up by XML data)
现在的solution是XPAAJ,只要一个method call就可以。
但是问题是,当xml data很大,并且有image data时候,
生成的PDF没有data,跟template没填东西一样。
考虑中的solutions:
1。用iText之类的package。不过不知道iText是否支持这种template?
2。研究一下XPAAJ是不是有什么tricks
说明:adobe现在已经不支持XPAAJ了,download都没了。
现在他们想推的LiveCycle,太贵,不能考虑。
各位有类似经验可以share一下么?谢谢! |
|
m******t 发帖数: 2416 | 17 pdf files are supposed to begin with "%PDF-".
So after this line:
byte[] pdf = pdfServcie.getPdfByte();
If you write the byte array to a local file, can you
open it in acrobat reader?
table |
|
T*****e 发帖数: 361 | 18 I guess you need to either do it from SQL Server side or from your servlet
code serving the PDF files. If you need to keep updating your SQL Server
database from Access, the latter may be a better approach.
From SQL Server side, simply read out the PDF field and write back the
portion with OLE header stripped.
From the servlet side, you may check the first four bytes. If the PDF
header presents, write the whole field to output stream. Otherwise, write
everything after the OLE header. This me |
|
y****e 发帖数: 1012 | 19 为啥总是报错:
我用lpr file -P $host, pr都不行
说:
You attempted to print a binary file. Printer output from binary files isn't
readable. You should probably print the source file or documentation instea
d.
cat file| acroread -toPostScript |lpr -P $host
这个命令可以打印能够转化为ps的pdf文档,但是有一大部分是不能转化的,比如用ado
be pdf printer保存的图像pdf。
请问大家这种文档怎么打印啊??
谢谢~ |
|
k*****r 发帖数: 21039 | 20 貌似work的不错。
download openoffice pdf importer first, install it as a plug in macro.
then you can open pdf and edit it in Draw, and export as pdf again.
works well. |
|
m********o 发帖数: 129 | 21 two solutions.
1, tex->dvi->ps, then convert ps to pdf using gswin32c with
parameter -dEmbedAllFonts=true
2, open your pdf file using acrobat, and print it as a new pdf. |
|
a****9 发帖数: 418 | 22 打出来的pdf每个字母之间的间隔一下变的巨大
我把一个好的pdf用pdf printer打出来也是这个德行, 截图如下
如果是ps文件就没有问题
有人遇到过这个问题么 |
|
r****t 发帖数: 10904 | 23 【 以下文字转载自 TeX 讨论区 】
发信人: repast (xebec), 信区: TeX
标 题: 土了,才发现 emacs 可以看 pdf ...
发信站: BBS 未名空间站 (Thu Jun 30 22:20:20 2011, 美东)
写文章的时候,只要直接打开 pdf 就行了。现在一般是 vertical split, 左边是 pdf
窗口,右边是 tex 文件。
设上 (global-auto-revert-mode 1), 这样就自动刷新了。我有点懒,觉得要开个
shell buffer 运行 latexmk, 这样就很爽了。 |
|