e*****e 发帖数: 17 | 1 就是就是.
要求编程快的, 算法复杂的, 运算速度要求不高的, 我用matlab
要求速度的, 不太复杂的, 我用c
特别要求速度的, 大量 matrix运算的, 我用fortran lapack 库
简单数字运算的, 我用计算器
特别简单的我用口算
工具就是工具嘛, 哪个工具最适合你的事情就用哪个工具.
btw, Lapack++(c的库)比相应fortran lapack库慢20%.
真正需要速度的fortran还是king.
c能够对付绝大多数情况.
感觉这两个语言都是需要的. |
|
m**********e 发帖数: 12525 | 2 明显c写的
因为目前没有java版本的lapack,10年前物理领域还能找到廉价屁民把
fortran翻译成c,妈的现在你找谁去把lapack写成java? |
|
m**********e 发帖数: 12525 | 3 我靠,一连phd都没有的麻脓,竟然也敢枉议学术界
妈的,学术界的潮流是matlab,年轻一代全部都在用
赶不上潮流的,老头还在用fortran/lapack,不怎么老的,都在用c/lapack |
|
|
|
y******7 发帖数: 1554 | 6 Matlab也是基于LAPACK算特征值和特征向量。
C++估计更慢,Fortran直接调用LAPACK有可能好点。貌似有限元的那些软件使用Fortran写的。
我个人经验,算eigenvalue/vector直接用Matlab就好,优化的很好了。除非你要stand-alone的可执行代码。
你的代码是基于并行计算的吗?如果不是的话,跟几核CPU关系不大,多上内存吧。算的比较久的话,放一个waitbar啥的提醒。
motherboard |
|
E*V 发帖数: 17544 | 7 >>> Recording sci-mathematics/octave in "world" favorites file...
* Messages for package sci-libs/blas-reference-20070226:
* blas has been eselected to reference
* Messages for package sci-libs/lapack-reference-3.2.1:
* lapack has been eselected to reference
>>> Auto-cleaning packages...
>>> No outdated packages were found on your system.
* Regenerating GNU info directory index...
* Processed 157 info files.
832 |
|
n******7 发帖数: 12463 | 8 server上装的是centos 5, 我的台机是ubuntu 10.04
一直忍受server的python2.4,前几天要用一个包,需要python2.6+,于是装了2.6,结
果安装numpy和scipy出问题了,跟LAPACK有关的。google了一圈,也没解决,只是看到
很多人建议不要自己试图折腾LAPACK和BLAS,很麻烦。 readline也有问题,只好继续
用2.4。ubuntu自带2.6,所以没问题。我记得当时server的2.4安装numpy也有问题,忘
记怎么折腾之后搞定的。
今天安装另一个东西,需要perl Moose module。结果server上cpan安装就是不对,ubuntu
一次
搞定。
很早之前,为了安装一个软件,不得不把server上过旧的一个lib给update了,结果不
小心让ssh都挂了,最后通过特殊通道重启了才ok
实在受不了了,准备跟老板建议适当的时候重装server。问题是老板完全不懂(最近的
笑话是把lock当作log out,跟我抱怨每次电脑backup后都log out。然后发现windows
做的是增量备份,大赞super ... 阅读全帖 |
|
k******n 发帖数: 35 | 9 Don't use Numerical Recipes, it has worst performance.
GSL is a good choice, but has to be compiled with some top libs like MKL
which is not free. You can compile GSL by using ATLAS which is a little
slower than MKL, but free. Essentially, ATLAS is an optimized BLAS + part of
LAPACK.
If you don't mind call FORTRAN from C++, you can call BLAS/LAPACK or ATLAS
directly. |
|
k******n 发帖数: 35 | 10 Don't use Numerical Recipes, it has worst performance.
GSL is a good choice, but has to be compiled with some top libs like MKL
which is not free. You can compile GSL by using ATLAS which is a little
slower than MKL, but free. Essentially, ATLAS is an optimized BLAS + part of
LAPACK.
If you don't mind call FORTRAN from C++, you can call BLAS/LAPACK or ATLAS
directly. |
|
t****t 发帖数: 6806 | 11 有人提了LAPACK啊. 当然乘法用不到LAPACK这么高, 确实BLAS就够了.
AT
AT
容C |
|
n******7 发帖数: 12463 | 12 这牛皮是不是吹爆了?别人要看代码他说卖掉了。
Case study: QR decomposition This is a basic numerical method from linear
algebra provided by libraries like LAPACK. The reference LAPACK
implementation is 2,077 lines of Fortran. I wrote an F# implementation in
under 80 lines of code that achieves the same level of performance. But the
reference implementation is not fast: vendor-tuned implementations like
Intel's Math Kernel Library (MKL) are often 10x faster. Remarkably, I
managed to optimize my F# code well beyond the ... 阅读全帖 |
|
i*****c 发帖数: 42 | 13 初学。。。不太懂。我要run一个Fortran的程序,要用到lapack。
我现在只知道lapack文件 (.a)文件的路径, 但是我不知道在下面来应该怎么做了。换
句话说,我不知道链接文件名是什么。 |
|
h****u 发帖数: 277 | 14 suppose the .a file is libxxx.a
then -lxxx
use nm to find out which library contains the function you needed. But I think
a better way is to find the manual of lapack.
PS. I do not use lapack.
换 |
|
f**l 发帖数: 2041 | 15 LAPACK是矩阵计算的最好的库. 其前身为LINPACK.
Matlab这个软件用的就是这些库.
查查netlib, 应该可以查到. LAPACK应该包含并行功能. |
|
s***t 发帖数: 195 | 16 the leading dimension is often used in LAPACK. it's basically
related to how you allocte your memory. and it follows the fortran
rule, i.e., column-order.
say you have a 5x5 matrix. but you can allocate a 10x10 block and
put the 5x5 matrix anywhere within the 10x10 block that fits. you
then tell the LAPACK routine the pointer to the first element of
the 5x5 matrix, and the leading dimension, which is 10, and the matrix
size, which is 5x5. then the routine will know where to find the
5x5 ma |
|
k******n 发帖数: 35 | 17 gsl用的是dense algorithms。在matlab里,如果你的矩阵是稀疏的,matlab会调用
umfpack来求解。即使对稠密矩阵,gsl也有可能比matlab慢,因为matlab用intel的
LAPACK。由于技术的原因,gsl还没有办法把LAPACK封装在其中,接口是主要的问题。
对于单纯的矩阵计算,超越matlab的效率是很难的。Actually, you are competing
with Intel's MKL and Tim Davis' UMFPACK. |
|
|
x*******1 发帖数: 28835 | 19 傻了不是, 知道matlab的kernel用啥写的? matlab还得depend on blas, lapack,
scalapack这一系列东西。 你没在mathwork干过,你就别吹牛了。会写2个script 就懂
计算机了? 给你roadrunner,10K+ core你的script language 就跑起来了?
老中最大的问题就是你这样的, 没到真的HPC跑过就开始吹了。
fortran的问题不是快慢的问题。fortran的code是一个历史包袱,很多军事和能源的
fortran code都是不能丢弃的,移植的代价也太大。 知道lapack是fortran写的,为什
么还要有个Clapack? |
|
w*******U 发帖数: 256 | 20 the fortran library 'lapack' or its C version 'lapacke' can do this job.
you can solve the eigenvalue/eigenfunction of a complex matrix with or
without hermite symmetry (the routine of the latter would run faster).
I
including |
|
n*s 发帖数: 752 | 21 lapack has C version. or u can call the fortran processures from C
lapack is the core of matlab and octave
if u just want eigenvalues, u can download octave, it's free and behaves
like matlab |
|
t******t 发帖数: 15246 | 22 “支持国产CPU的编译系统及工具链”是 国家核高基重大专项课题(课题编号
为2009ZX01036-001-002),计算所是课题牵头承担单位,联合承担单位有中科院软件
所、北京大学、同济大学、中国科技大学。2010年课题取得了如下进展:所研制的支持
国产龙芯CPU的高性能编译系统,支持多种语言,性能高于商用编译器 GCC 的 30% 以
上;所开发的二进制翻译系统,性能达到GCC所产生代码的65%,并成功地为龙芯移植了
flash播放器。另外,本项目在高性能数学库软件包、程序调试和分析工具等方面,也
已基本上完成了合同约定的指标。具体进展如下:
龙芯基本编译系统的健壮性已基本达到产品编译器的水平。主要编译选项(O0/O2/
O3/ ipa/profiling)通过了 SPECCPU 2006 测试程序,SuperTest 通过率高于
GCC 的通过率,能够支持像 GCC 4.4 和 mplayer 等实际应用
程序,支持 Java、C++ 异常处理和 OpenMP3.0。结合龙芯3号处理器的新特征,通过数... 阅读全帖 |
|
r********n 发帖数: 7441 | 23 这啥意思“ 高性能数学库方面已完成 BLAS、LAPACK、FFT、直接解法器和迭代解法器5
个模
块的开发工作”
把人家的现成的库拿来主义?
O2/ |
|
r********n 发帖数: 7441 | 24 话是这么说,记得以前看BLAS和LAPACK的源代码,貌似它们的库函数里很多容错处理都
没有,感觉就是简单实现一下课本中的算法,真正商业化,确实得加很多判断,除非预
处理做的比较牛
CPU |
|
|
r*g 发帖数: 3159 | 26 LAPACK的底层,blas,就有各种实现。不是另一个帖子就是讲goto blas的。这种工作
,我国做不做? |
|
b***y 发帖数: 14281 | 27 kao, 这个级别跟前面几个根本差的不是一点半点啊, 刚才没细看, 搞半天lapack 也算
原创科研啊?真是马工得势天下大乱。 |
|
b******3 发帖数: 4385 | 28 排得够靠后了啊,lapack可能算不上原创,但是产生的实际影响还是很大的 |
|
S****8 发帖数: 401 | 29 我没说我是内行, 我更从来没说C是niche market, 至于fortran是不是, 这个有点底气
你也不用在这里justify了,我自己以前搞半导体现在算是搞IT的, 真的好些年没听说过
有人用fortran了
对了,你既然知道CFD, 肯定也知道lattice boltzmann这些, 搞这个的大部分
都是C/C++了, 大概情况就是新东西都是C/C++, 很多老的也慢慢转成了C/C++比如很多
FEM code , 因为做数值计算的c/c++的performance 不比fortran差了,
现在有一堆 lapack c++ wrapper, 都是用的c++ metatemplating, |
|
m**********e 发帖数: 12525 | 30 java写了个GUI而已
原因很简单,因为目前没有java版的lapack,不但没有java版的,
连c++版的都没有 |
|
t***s 发帖数: 4666 | 31 你确定底层的BLAS 和LAPACK也是C++ 写的?
needs |
|
|
m**********e 发帖数: 12525 | 33 你根本没做过大规模的计算,就做个作业,最多微机上运行半小时,
但是,如果你要做需要运算一周才能有结果的那种,你说,谁他妈有时间等一周发现错
的再回来折腾?上机job到时候插不上去怎么办?项目完不成怎么办?
所以,大家显然只能用久经考验的f版lapack,而且一个字也不能改,绝对不能用c/c++
,谁也不能保证自己折腾出来的玩意不犯个错 |
|
g****r 发帖数: 1607 | 34 NVIDIA移植了部分lapack代码跑在他们的gpu上,数值计算多的应用还是有帮助的。 |
|
o****y 发帖数: 182 | 35 二手,09年4月买来的,一切都运转良好。卖800刀吧,欢迎给建议。
主要配置如下:
44C5186 SBB INT CORE 2DUOPROCP 8600 2,4GH
内存 3G PC3-8500DDR3 SDRAM
硬盘 250GB HDD,5400RPM
电池 ThinkPad X200 Series 9 cell Li-Ion Battery
显示屏 12.1WXGA2X2ULIIATCM,W/OBT
操作系统 Vista。。。
把具体参数配置贴上来,可查找到您感兴趣的配置。
7454CTO THINKPAD X200
44C5183 VBB 5-1MEDIACARDREADER+MODEM
44C2615 SBB THINKPAD 11B/G WLAN PCI 3
44C5194 SBB INTEGRWIRELESSWIDEAREANETW
44C5197 SBB THINKPADX200SER.9CELLENH.
41W1787 SBB CPK NORTH AMERICA
44C5249 SBB LAPACK US ENGL
44C5295 SBB PAC |
|
d********f 发帖数: 43471 | 36 cygwin下面只用两个fftw和lapack两个库,居然两台机器给不同的结果。。。。 |
|
o****y 发帖数: 182 | 37 二手,09年4月买来的,一切都运转良好。卖800刀吧,欢迎给建议。
主要配置如下:
44C5186 SBB INT CORE 2DUOPROCP 8600 2,4GH
内存 3G PC3-8500DDR3 SDRAM
硬盘 250GB HDD,5400RPM
电池 ThinkPad X200 Series 9 cell Li-Ion Battery
显示屏 12.1WXGA2X2ULIIATCM,W/OBT
操作系统 Vista。。。
把具体参数配置贴上来,可查找到您感兴趣的配置。
7454CTO THINKPAD X200
44C5183 VBB 5-1MEDIACARDREADER+MODEM
44C2615 SBB THINKPAD 11B/G WLAN PCI 3
44C5194 SBB INTEGRWIRELESSWIDEAREANETW
44C5197 SBB THINKPADX200SER.9CELLENH.
41W1787 SBB CPK NORTH AMERICA
44C5249 SBB LAPACK US ENGL
44C5295 SBB PAC |
|
s**u 发帖数: 2294 | 38 麻烦同胞给refer一下,多谢,老婆过几个月要生孩子了,希望尽快解决工作问题,多
谢!
附上我的技术总结供参考。
Skills
• Quick and adaptive learner able to absorb and apply technology to
solve a wide variety of complex problems
• Object-oriented code design and implementation based on software
engineering principles
• Software development using C/C++, Python, Matlab and Fortran 77/
90 in a Unix, Linux or Windows environment
• Excellent knowledge of high performance computing architectures
using Message Passing Int... 阅读全帖 |
|
|
|
s***e 发帖数: 403 | 41 【 以下文字转载自 USTC 讨论区 】
发信人: seele (nerv), 信区: USTC
标 题: 找CS方面工作求校友内推
发信站: BBS 未名空间站 (Sat Jul 13 15:46:57 2013, 美东)
看出我是谁的给点面子,就别说破了。如果哪位师兄师姐师弟师妹有个什么软件公司的
码工内推,不妨给我试试,应该不会丢大家的脸。
干了几年,老板想让我拿硕士毕业,貌似不是很想给我博士学位。实验室里做的东西基
本上不适合找工作,所以现在求CS方面的机会。
技能:6+年C/C++经验,熟悉C++11,熟悉stl/boost,熟悉过程式/面向对象/模板元风
格编程,了解lambda编程,基本上可以短期轻松上手任何不是LISP系列的语言。了解
windows下的MFC开发,熟悉qt4库,熟悉linux系统和shell编程,熟悉基本算法和数据
结构,熟悉常用设计模式。有独立开发经验。有并行开发(pthread, openmp, intel
tbb)和性能优化(Vtune)的经验。能看懂汇编,但是自己写就不行了。有建模经验。
了解计算机基本架构(差不多是看完CSAPP那本书的水平... 阅读全帖 |
|
s**u 发帖数: 2294 | 42 我是化工的博士,但是从本科到博士都修了几乎所有计算机的课程,在博士毕业后在th
计算机做的博后,又去了一个研究机构也做的计算机方面的工作。主要是做高性能计算
,并行计算等,各种语言写程序也不错。
我主要做高性能计算,在并行计算和代码优化方面有很多项目经验。数学基础也比较好
。自己写代码方面,Unix, Linux and Windows; C/C++, Fortran 77/90, Matlab and
Python; MPI, OpenMP, PETsc, Trilinos; gdb, Totalview, Valgrind; Code level
tuning with Vtune and Oprofile; BLAS, LAPACK, FFTW, direct and iterative
solver都没问题。
因为之前想做研究,所以看到一个老师和我可能有互相弥补合作能做好文章,就到美国
来博后了。事实上,因为各有所长,半年了我的东西已经差不多了,可以写文章了,也
是这个领域少有人做的东西。不过因为funding等问题,老板到期不准备再续了。而我
也觉得自己非常希望回到计算机领域... 阅读全帖 |
|
p******t 发帖数: 228 | 43 原来BLAS, LAPACK, FFTW, direct and iterative solver也可以写上啊Orz |
|
p******t 发帖数: 228 | 44 所以我要跪了,光一个lapack的源码就差不多50w行,精通实在不易
Orz |
|
a*******g 发帖数: 364 | 45 7458CTO THINKPAD X200
44C5184 VBB SD CARD READER
44C2615 SBB THINKPAD 11B/G WLAN PCI 3
44C5196 SBB THINKPADX200SER.6CELLENH.
41W1787 SBB CPK NORTH AMERICA
44C5249 SBB LAPACK US ENGL
44C5295 SBB PACK US
44C5199 SBB 1GB PC3-8500DDR3 SDRAM
43Y3376 SBB MT 7458 SYSTEM LABEL
44C6363 SBB 12.1WXGA2X3ULCNIIAT,W/OBT
43Y3366 SBB BLUETOOTH SPACER
44C6284 SBB I.C2DPRP8700(2.53GHZ3MB L2
43Y3369 SBB CLEAR PLATE FOR X200 WLAN
42X2659 SBB ENERGY STAR 4.0 P |
|
g*****u 发帖数: 14294 | 46 并行计算历史很长,如果通吃,那IBM以前还搞那么变态的CPU干嘛,INTC的都不算啥。
云计算,浮点少不了啦。连个SAS,MATLAB都跑不动,咋用?线性代数程序库LINPACK/
LAPACK总得支持一下吧。
搞两个core, 简单的OS支持,MPI啥的都还好办。core一多,scalability问题就来了。具体应用开发问题,是以前并行计算领域都讨论很多的。以前那个IBM的深蓝啥的,多少core记不清了,有没有256 core? |
|
m*****r 发帖数: 3822 | 47 支持归支持效率呢?至少现在lapack这种还处在学术研究阶段。主要问题是GPU属于
多core少内存,所以对于大的矩阵并行整个算法都需要重新设计。目前的情况就是在
一些特定问题,或者低精度情况下GPU确实比CPU快。但是真正critical的应用还差
很远。 |
|
g*****u 发帖数: 14294 | 48 我那个35W不落实。
假定你的100W是对的。100W降到35W,对学校搞研究的,可能很不错。感觉对工业界,
工程的人,还是不够震撼。毕竟你还是一个数量级别的东西。软件上,并行串行还是差
别很大的,要费很多事情。固有installed base还不用讲。
另外速度coremark指标仅仅是一个,浮点恐怕差得不是一点半点。至少得找找LINPACK/LAPACK的benchmark结果对比。
暂时结论:server应用恐怕也就是说说。INTEL没准搞省电行。
AMD的 bobcat咋样了。
INTEL也有个啥啥,巴赛落娜通讯展有秀demo机。 |
|
s******v 发帖数: 4495 | 49 你可以google一下这个microserver,facebook。我的理解是,对于相当一部分应用,
可以平行
的lightweight process,这种low-power cpu是非常实用。例如webserver. 浮点肯定不
灵。
现在data center里面,功耗和cooling是最大的opex,HDD换成SSD是一个方法,还有就
是cpu
了。你看seamicro一个10u的server里面可以放512颗atom,1u的server顶多可以放1/2
i7。
这个power density差别太大了。intel的cpu还是很NB的,不可否认,不过少了10-20%
的市场
对他而言,而且还可能要降价去保护其他的市场,实在是太糟糕了。
LINPACK/LAPACK的benchmark结果对比。 |
|
b*******t 发帖数: 33714 | 50 有人用过blas/lapack/linpack吗? |
|