y**********u 发帖数: 429 | 1 太好了,谢谢提醒!找到了全称,列在下面,以备其他感兴趣的朋友使用:
Santikos Palladium AVX - West Houston
7301 W Grand Pkwy S, Richmond, TX 77407
(281) 239-4200 |
|
y**********u 发帖数: 429 | 2 Santikos Palladium AVX - West Houston |
|
T***N 发帖数: 1835 | 3 Santikos Palladium AVX - West Houston,这个上周去看了蜘蛛侠, 不是3d的,这次
买了ikea旁边那个,去看哥拉斯。。。。visa signature买一送一的电影票。 |
|
j********6 发帖数: 191 | 4 特效ZENZENZEN棒啊!
好看。我老公前10分钟都一直张着嘴。
比MAN OF STEEL好看太多了。
我们看的AVX 3D。我们这里IMAX不多。
强烈推荐,此片一定要看IMAX 3D。
那个菊地女演员真厉害,居然在这种投资1.8亿元的好莱坞主流影片中担任一号女主
角。估计是目前最有影响力的亚洲女星吧。 |
|
t****g 发帖数: 35582 | 5 嗯,上cpp应该结合汇编混合编程,需要速度的地方要考虑用mmx,sse,avx长矢量指令
优化。 |
|
j****c 发帖数: 19908 | 6 我现在用的赤道仪是celestron AVX, payload 只有30lbs,正考虑换一个G11
你说的是那几个红绿蓝的点?那些不是坏点,我是用RGB三个颜色来做color synthesis
的,那几个可能是没align好所以没合成在一起 |
|
|
|
a*********e 发帖数: 518 | 9 AVX虽然还没有软件支持发力,不过肯定是迟早的事。Intel的号召力比NV和AMD牛多了。
video decoder和coder的优化已经看出很NB了,新一代转码王。
感觉就像当年的Pentium MMX。 |
|
|
t****g 发帖数: 35582 | 11 avx目前还没有软件支持,不过intel的号召力强,估计很多就普及了。
那个quick sync可是立竿见影的。给iphone转码很给力,呵呵。 |
|
t*******y 发帖数: 2432 | 12 视频编解码那是刚刚的,连cuda都不是对手,aes-NI也很猛,avx浮点提速,就等软件来
应用了 |
|
M********y 发帖数: 1964 | 13 据说做计算的话SB i7比较好,AVX指令的加入,提升了不少浮点性能。不过现在P67的
主板现在被召回了。Intel又发了个声明,说只要不用SATA III口的机器,可以继续卖
。就算埋个炸弹给用户。 |
|
t****t 发帖数: 6806 | 14 this depends on your application, i have no idea. 2600K is about the same
level with 960 or 970. however 1366 has roughly 50% more raw memory
bandwidth than 1155/1156. but 1155 support AVX instruction and better GPU
support if your application supports it.
if as dreamfrog said your application heavily depends on disk I/O, then
these don't matter at all. |
|
t****t 发帖数: 6806 | 15 比软解的话2400还有AVX呢...当然其实没人这么用就是了
其实就是那句话, X58过时了, 何况配低端的i7-920. 在对IO要求不高的时候, 没必要.
i5-2xxx就算不超, 也不见得会比920差, 要是换2500K应该可以稳胜920的, 最重要的
是价钱也不比920+X58贵. 不超就配个h67, 超就配个z68, 别说什么高端低端, 好用就
好了. h67说是低端, 其实差在哪里了? 不能超频, 没有三通道, IO差一些, 不能SLI,
这都是有的, 但是一般人不会在乎. 花钱在SSD和好显卡上当然是对的了.
%- |
|
|
l******n 发帖数: 1683 | 17 会不会是你的编译器/库不支持FX-8350的AVX?
。 |
|
l******n 发帖数: 1683 | 18 在2700K上面的性能依赖icc和mkl么? 我感觉有可能是你用的编译器和库不支持FX-8350
的AVX指令集. 如果只能用SSE4的话, 那么理论上正好差一半的性能. |
|
l*******e 发帖数: 170 | 19 3rd Generation Intel® Core™ i5 Processors Previous Generation
Intel® Core™ i7 Processor
Processor Number i5-3210M i7-720QM
Launch Date Q2'12 Q3'09
# of Cores 2 4
# of Threads 4 8
Cache 3.0 MB 6.0 MB
Clock Speed 2.50 GHz 1.60 GHz
Max Turbo Frequency 3.10 GHz 2.80 GHz
Bus/Core Ratio 25 12
Bus Type DMI DMI
Instruction Set 64-bit 64-bit
Instruction Set Extensions AVX SSE4.2
Lithography 22 nm 45 nm
Max TDP 35 45 |
|
a***e 发帖数: 27968 | 20 spec is standard CPU raw power.
but in linpak, i7 is much better.
gen 2 introduce AVX, which improve
the float point quite a bit if you can use it. |
|
l******n 发帖数: 1683 | 21 一代i7比linpack会死得很惨的. 一代i7还不支持AVX, 算浮点峰值的话, 4核的一代i7
只能相当于同频的2核的二代三代i3. |
|
a***e 发帖数: 27968 | 22 intel burn俺又不是没跑过
支持avx补不回来cache不足miss idle
小点的结果很好,大点的就挂了
i7 |
|
|
|
g*********n 发帖数: 808 | 25 双核变单核,怎么回事?
Core i3 2377m处理器本应双核四线程,昨天都好好的。今天用cpu-z一检查,发现成了
单核。
有图为证。
http://ark.intel.com/products/54834/Intel-Core-i3-2377M-Process
Processor Number i3-2377M
# of Cores 2
# of Threads 4
Clock Speed 1.5 GHz
Intel® Smart Cache 3 MB
DMI 5 GT/s
Instruction Set 64-bit
Instruction Set Extensions AVX
Embedded Options Available
No
Lithography 32 nm
Max TDP 17 W
咋啦? |
|
w*****s 发帖数: 2896 | 26 这下要爽死了, 不光快, 也能支持AVX了.
给个消息的出处吧 |
|
|
T****O 发帖数: 407 | 28 主要打算利用动力学模拟来试验有关蛋白分子结构的一些想法。先依靠GROMACS,因为
它完整且免费。但以后也可能用Amber,CHARMM或其他商业包。
首先就有一个软件问题,GROMAS主页上好像不待见双精度浮点数的必要性,认为单精度
足够。但想当年我用单精度算一个系统,三个月后被一句“你为什么不用双精度”打回
来,那个惨哪。哪位同学仔细验证过GROMACS单精度、长时间运行结果的可靠性没有?
初步目标是,以2fs步长跑到一微秒左右的时候,已知结构的小蛋白分子不会炸开。
操作系统用CentOS应该没问题吧?我可能先装Windows,用Prime95烤机,因为熟悉。
接下来是硬件问题。GROMACS v5 的CUDA实现看上去不错。Amber那帮人干脆就开卖自己
背书的CUDA硬件。所以作为起步,我打算入一块GTX 760 或 680,哪个更好?再推荐一
个品牌?
以上面说的计算为目的,显存多大比较合适?有没有更合适的推荐?预算上限$500左右
,所以Titan不考虑了。Amber评测C2050/C2070远不如GTX 680,也暂不考虑,除非捡到
$100的。
要是哪个同学成功编译验证... 阅读全帖 |
|
T****O 发帖数: 407 | 29 Xeon Phi的x86不那么重要,重要的是Intel在上面提供了FMA, AVX,而且集成度高,对
Opteron用户很有吸引力。 |
|
|
t*****z 发帖数: 1598 | 31 现在Xeon E5-2600(v1, Sandy Bridge,LGA2011)越来越便宜了,比1366贵不了多少了
。如果自己攒机器,现在可以考虑了。尤其是对应的二手整机(Dell T7600、HP
Z820等)现在还不便宜,所以你心理上不会觉得攒机贵。
比如这Intel的双路大主板,好几道16x的PCIe3.0,SATA3和SAS俱全,一堆USB端口,只
要200美元了。(eBay:131609027818)
CPU,E5-2670只要$270 obo了(161846187311),E5-2680也只要$340了(
161849895641),都是八核心的高端货。
内存:DDR3-1600 REG现在也不算贵了,比如这8x8=64GB的只要$350 obo(
221909181556)。
其他配件跟平台无关,不管1366还是2011甚至2011v3都得花这么多钱。一般来说300美
元内可以搞定(机箱、电源、散热、低端显卡)。
2011平台(Sandy Bridge)之于1366平台(Westmere):核心数8比6,缓存20比12MB,
总线8.0比6.4,内存通道4比3,内存频率... 阅读全帖 |
|
m*****n 发帖数: 3644 | 32 问一个。如果不支持新指令集AVX,2011的低频单核和1366的高频单核比较,性能有提
高么? |
|
m*****n 发帖数: 3644 | 33 这电脑买回来就用性能杠杠的,秒杀所有的主流笔记本。
只要不用到一些新指令集AVX什么的,不要说上网看电影,就是做科学计算都不输主流4
核i7多少。 |
|
z*********e 发帖数: 10149 | 34 there are huge hugs with skylake nonk oc. avx is not working, l1 and l2 run
at low speed |
|
|
|
d******a 发帖数: 32122 | 37 它的处理器标配8核心Intel Xeon,另外还有10核心以及最高可配置的18核心36线程处
理器版本可选,二级缓存容量翻两倍,AVX指令集宽度翻倍。同时它配备了全新的AMD
Radeon Vega显卡,16GB HBM2显存,2048-bit位宽,32位浮点性能最高11TFlops。内存
方面也十分强大,标配32GB DDR4-2666,支持ECC,最大能扩展到128GB;硬盘标配1TB
SSD,最大4TB,而且可选双硬盘。
这款产品售价为4999美元起步,约合34008元,将于今年12月上市。 |
|
T****O 发帖数: 407 | 38 老机器老芯片其实啥都好,最大的毛病是指令集太老了。C2D没有AVX,AES等等,稍微
先进一点的软件就不支持了。C2D也不支持VT-d,就这一条,新一点的虚拟机都没法发
挥性能。 |
|
d********g 发帖数: 10550 | 39 很多是上游的bug,Arch由于用得早,一般是最早让问题暴露的distro,也修得最快
像glibc 2.15有个AVX的bug,Xen虚拟机会kernel panic。也是Arch最早发现的
CentOS就别指望了,6.2还在用glibc 2.12,要等它来发现2.15的bug,等100年吧 |
|
t****t 发帖数: 6806 | 40 如果是native的, 很好理解啊, 有AVX支持了嘛, 正常的x64应该是enable到SSE3 |
|
r*****3 发帖数: 143 | 41 中文名: Intel® 64 and IA-32体系结构:软件开发人员手册
原名: Intel® 64 and IA-32 Architectures Software Developer's Manual
作者: Intel Corporation
资源格式: PDF
版本: 文字版
出版社: Intel Corporation
书号: 25462-042US
发行时间: 2012年03月
地区: 美国
语言: 英文
简介:
汇编语言和高级语言的最根本的区别在于:在汇编语言中,程序员必须掌握数据存储和
机器相关的大量细节。与高级语言相比,在声明和移动数据时,汇编器给了程序员极大
的自由。汇编器只进行很少的错误检查,但却提供了大量的操作符和寻址表达式,使程
序员几乎能够做任何事情。然而,这种自由是必须付出一定代价的。这种代价就是在开
始编写有意义的程序之前,开发人员必须掌握大量的细节知识。因而这也是《Intel&
reg; 64 and IA-32 Architectures Software Developer's Manuall》一书的功能所在。
目录:
Volum... 阅读全帖 |
|
t*****t 发帖数: 52 | 42 现在int比double慢,见intel AVX的int乘法、除法指令和double的乘除法指令最小周
期数。
int比起float的好处就是精度有保障,因为存的是准确值,精度不多不少就是1.
FPU |
|
T********i 发帖数: 2416 | 43 另外,GPU对我来讲没啥用。关键还是IO瓶颈。等你把数据放到GPU memory里面,已经
实现毫秒级延迟了。
SSE/AVX加速我倒是手工写过。简单矩阵运算快了好几倍,还是值得的。 |
|
T********i 发帖数: 2416 | 44 别说,这个gpu, SSE,AVX之类的,我还真玩过。
而且手工写的code每天都在跑。
在你身上浪费时间真不值。 |
|
k*******d 发帖数: 1340 | 45 You are right, derivatives pricing is one place where C++ is necessary as I
mentioned in 42nd floor. But
usually only the core library, which is used together with front end system
(GUI, reporting, etc) written in Java or Python.
I think the reason that C++ is necessary is because (1) legacy codes are in
C++ and most experienced quants only know C++ (2) C++ is easier to hook up
with HPC techniques like GPU/AVX/OpenMP, etc, as well as linear algebra
libraries. (3) It is computational heavy and th... 阅读全帖 |
|
k*******d 发帖数: 1340 | 46 You are right, derivatives pricing is one place where C++ is necessary as I
mentioned in 42nd floor. But
usually only the core library, which is used together with front end system
(GUI, reporting, etc) written in Java or Python.
I think the reason that C++ (but not Java/ C#) is necessary is because (1)
legacy codes are in
C++ and most experienced quants only know C++ (referring to high level
compiled language like C++, Java, C# here, of course one can know lots of
scripting language Python/Perl... 阅读全帖 |
|
G**Y 发帖数: 33224 | 47 自己瞎编了一次openblas,没快多少似乎还有bug (运算结果不对)
决定放弃了。Intel的MKL有免费的吗?
我比了一天,根据binary的情况:
小矩阵运算(20x20之类的),base往往最快。矩阵大了以后atlas和openblas就快很多
了。
但是openblas的multi thread很慢。(我用R测试的,我的R可能是单线程的)。
我的程序刚好是大量的小矩阵,似乎这些NB的blas也没用。
另外我在virtualbox里面跑,不支持AVX。
这东西折腾起来太费劲了。我还是再等等算了。 |
|
T********i 发帖数: 2416 | 48 这个人蠢,搞不清楚状况。
其实有票必须出这点上我确实故意在占便宜。
至于是不是有票?就是要找到a-b一直都一个座位空着,这个甚至能够AVX指令优化。 |
|