第3页 - 关于avx的讨论汇总 - 话题女王

y**********u
发帖数: 429

太好了，谢谢提醒！找到了全称，列在下面，以备其他感兴趣的朋友使用：
Santikos Palladium AVX - West Houston
7301 W Grand Pkwy S, Richmond, TX 77407
(281) 239-4200

y**********u
发帖数: 429

来自主题: Texas版 - 屯子里最好的IMAX影院是哪一家啊？

Santikos Palladium AVX - West Houston

T***N
发帖数: 1835

来自主题: Texas版 - 屯子里最好的IMAX影院是哪一家啊？

Santikos Palladium AVX - West Houston,这个上周去看了蜘蛛侠，不是3d的，这次
买了ikea旁边那个，去看哥拉斯。。。。visa signature买一送一的电影票。

j********6
发帖数: 191

来自主题: Movie版 - PACIFIC RIM 归来

特效ZENZENZEN棒啊！

好看。我老公前10分钟都一直张着嘴。
比MAN OF STEEL好看太多了。
我们看的AVX 3D。我们这里IMAX不多。
强烈推荐，此片一定要看IMAX 3D。
那个菊地女演员真厉害，居然在这种投资1.8亿元的好莱坞主流影片中担任一号女主
角。估计是目前最有影响力的亚洲女星吧。

t****g
发帖数: 35582

来自主题: PhotoGear版 - 问一下直方图的理论问题

嗯，上cpp应该结合汇编混合编程，需要速度的地方要考虑用mmx，sse，avx长矢量指令
优化。

j****c
发帖数: 19908

来自主题: PhotoGear版 - M101旋涡星系

我现在用的赤道仪是celestron AVX, payload 只有30lbs，正考虑换一个G11
你说的是那几个红绿蓝的点？那些不是坏点，我是用RGB三个颜色来做color synthesis
的，那几个可能是没align好所以没合成在一起

j****c
发帖数: 19908

来自主题: PhotoGear版 - 【2015总结】天文摄影第三年

这个
http://www.celestron.com/browse-shop/astronomy/accessories/navi
你的CGEM DX有没有dec cogging？我跟踪的时候经常遇到RA正常但DEC误差越来越大最
后拉不回来，不确定是不是dec cogging
搜了一下，celestron的老架子有dec cogging的问题，新架子没有，我的AVX就是好的

j****c
发帖数: 19908

来自主题: PhotoGear版 - Oregon日食照片和视频

便携的话用celestron avx

a*********e
发帖数: 518

来自主题: Hardware版 - 看来Sandy Bridge类似当年的MMX

AVX虽然还没有软件支持发力，不过肯定是迟早的事。Intel的号召力比NV和AMD牛多了。
video decoder和coder的优化已经看出很NB了，新一代转码王。
感觉就像当年的Pentium MMX。

t*******y
发帖数: 2432

来自主题: Hardware版 - 这个i7超到4.0能比

avx据说理论上可以提升2倍

t****g
发帖数: 35582

来自主题: Hardware版 - 这个i7超到4.0能比

avx目前还没有软件支持，不过intel的号召力强，估计很多就普及了。
那个quick sync可是立竿见影的。给iphone转码很给力，呵呵。

t*******y
发帖数: 2432

来自主题: Hardware版 - 运行了一个程序比较一下i7-860和Core2duoE6600

视频编解码那是刚刚的，连cuda都不是对手，aes-NI也很猛，avx浮点提速，就等软件来
应用了

M********y
发帖数: 1964

来自主题: Hardware版 - 想装一台台式机，请大家帮忙看看内存和处理器

据说做计算的话SB i7比较好，AVX指令的加入，提升了不少浮点性能。不过现在P67的
主板现在被召回了。Intel又发了个声明，说只要不用SATA III口的机器，可以继续卖
。就算埋个炸弹给用户。

t****t
发帖数: 6806

来自主题: Hardware版 - 犹豫了好久，还是来这里问问吧。高性能装机求助。

this depends on your application, i have no idea. 2600K is about the same
level with 960 or 970. however 1366 has roughly 50% more raw memory
bandwidth than 1155/1156. but 1155 support AVX instruction and better GPU
support if your application supports it.
if as dreamfrog said your application heavily depends on disk I/O, then
these don't matter at all.

t****t
发帖数: 6806

来自主题: Hardware版 - 这个配置值么？

比软解的话2400还有AVX呢...当然其实没人这么用就是了
其实就是那句话, X58过时了, 何况配低端的i7-920. 在对IO要求不高的时候, 没必要.
i5-2xxx就算不超, 也不见得会比920差, 要是换2500K应该可以稳胜920的, 最重要的
是价钱也不比920+X58贵. 不超就配个h67, 超就配个z68, 别说什么高端低端, 好用就
好了. h67说是低端, 其实差在哪里了? 不能超频, 没有三通道, IO差一些, 不能SLI,
这都是有的, 但是一般人不会在乎. 花钱在SSD和好显卡上当然是对的了.

%-

c********l
发帖数: 8138

来自主题: Hardware版 - 装一个NAS，贴配置，求拍

Thanks.
看了一下,带T和不带T的区别不大，那么咱就不带T了吧，嘿嘿
不过您说的620用的边角料，有些疑惑，毕竟620才$50，而2100要$100
老美的一些review上说620和2100在实际使用中的区别不是很大
http://www.avsforum.com/avs-vb/showthread.php?t=1343135
有没有什么办法能justify 这50刀？
HyperThreading, AVX ？具体应用(做家庭的NAS、media server)中差别大不？

http://www.silentpcreview.com/article1202-page7.html

l******n
发帖数: 1683

来自主题: Hardware版 - AMD确实很差

会不会是你的编译器/库不支持FX-8350的AVX?

。

l******n
发帖数: 1683

来自主题: Hardware版 - AMD确实很差

在2700K上面的性能依赖icc和mkl么? 我感觉有可能是你用的编译器和库不支持FX-8350
的AVX指令集. 如果只能用SSE4的话, 那么理论上正好差一半的性能.

l*******e
发帖数: 170

来自主题: Hardware版 - 哪位专家给分析一下哪个更快，i5-3210M vs i7-720QM

3rd Generation Intel® Core™ i5 Processors Previous Generation
Intel® Core™ i7 Processor
Processor Number i5-3210M i7-720QM
Launch Date Q2'12 Q3'09
# of Cores 2 4
# of Threads 4 8
Cache 3.0 MB 6.0 MB
Clock Speed 2.50 GHz 1.60 GHz
Max Turbo Frequency 3.10 GHz 2.80 GHz
Bus/Core Ratio 25 12
Bus Type DMI DMI
Instruction Set 64-bit 64-bit
Instruction Set Extensions AVX SSE4.2
Lithography 22 nm 45 nm
Max TDP 35 45

a***e
发帖数: 27968

来自主题: Hardware版 - 屌丝的近期比较失败的PC升级

spec is standard CPU raw power.
but in linpak, i7 is much better.
gen 2 introduce AVX, which improve
the float point quite a bit if you can use it.

l******n
发帖数: 1683

来自主题: Hardware版 - 屌丝的近期比较失败的PC升级

一代i7比linpack会死得很惨的. 一代i7还不支持AVX, 算浮点峰值的话, 4核的一代i7
只能相当于同频的2核的二代三代i3.

a***e
发帖数: 27968

来自主题: Hardware版 - 屌丝的近期比较失败的PC升级

intel burn俺又不是没跑过
支持avx补不回来cache不足miss idle
小点的结果很好，大点的就挂了

i7

p**o
发帖数: 3409

来自主题: Hardware版 - 同志们，好消息啊

http://www.xbitlabs.com/articles/cpu/display/core-i7-4770k_12.h
它那个LinX-AVX的测试可靠不？max-load下4770比3770温度高这么多，Intel不会自己
不知道吧？

c****t
发帖数: 5452

来自主题: Hardware版 - 退役XEON攻势第二波：Intel最廉价6核心L5639

没有avx,鸡肋啊

g*********n
发帖数: 808

来自主题: Hardware版 - 双核变单核，怎么回事？

双核变单核，怎么回事？
Core i3 2377m处理器本应双核四线程，昨天都好好的。今天用cpu-z一检查，发现成了
单核。
有图为证。
http://ark.intel.com/products/54834/Intel-Core-i3-2377M-Process
Processor Number i3-2377M
# of Cores 2
# of Threads 4
Clock Speed 1.5 GHz
Intel® Smart Cache 3 MB
DMI 5 GT/s
Instruction Set 64-bit
Instruction Set Extensions AVX
Embedded Options Available
No
Lithography 32 nm
Max TDP 17 W
咋啦？

w*****s
发帖数: 2896

来自主题: Hardware版 - 一大波sb-ep的xeon正在袭来

这下要爽死了, 不光快, 也能支持AVX了.
给个消息的出处吧

l**k
发帖数: 1755

来自主题: Hardware版 - 数值计算的时候怎么提高CPU的使用率？

use simd, sse or avx

T****O
发帖数: 407

来自主题: Hardware版 - 求教科学计算的软硬配置

主要打算利用动力学模拟来试验有关蛋白分子结构的一些想法。先依靠GROMACS，因为
它完整且免费。但以后也可能用Amber，CHARMM或其他商业包。
首先就有一个软件问题，GROMAS主页上好像不待见双精度浮点数的必要性，认为单精度
足够。但想当年我用单精度算一个系统，三个月后被一句“你为什么不用双精度”打回
来，那个惨哪。哪位同学仔细验证过GROMACS单精度、长时间运行结果的可靠性没有？
初步目标是，以2fs步长跑到一微秒左右的时候，已知结构的小蛋白分子不会炸开。
操作系统用CentOS应该没问题吧？我可能先装Windows，用Prime95烤机，因为熟悉。
接下来是硬件问题。GROMACS v5 的CUDA实现看上去不错。Amber那帮人干脆就开卖自己
背书的CUDA硬件。所以作为起步，我打算入一块GTX 760 或 680，哪个更好？再推荐一
个品牌？
以上面说的计算为目的，显存多大比较合适？有没有更合适的推荐？预算上限$500左右
，所以Titan不考虑了。Amber评测C2050/C2070远不如GTX 680，也暂不考虑，除非捡到
$100的。
要是哪个同学成功编译验证... 阅读全帖

T****O
发帖数: 407

来自主题: Hardware版 - 近几年来cpu性能的提升实在太缓慢令人绝望

Xeon Phi的x86不那么重要，重要的是Intel在上面提供了FMA, AVX，而且集成度高，对
Opteron用户很有吸引力。

m*****n
发帖数: 3644

来自主题: Hardware版 - T7500 12核高频双路工作站卖白菜价了

http://www.ebay.com/sch/i.html?_from=R40&_sacat=0&_nkw=t7500+2+
T7500 12核高频双路工作站卖白菜价了，而且各种配置都有。dual X5680,3.3ghz ，
24gb的，没硬盘没os，卖660。加win7 pro加小硬盘，贵50来元。加到48gb ram，又加6
,70。还有大硬盘或者硬盘阵列，96gm ram，各种组合都有。
同样的组合，也可以upgrade到dual x5690,3.47 gb的主频，贵150多元，快不到5%。我
觉得不值了。没硬盘没os，24gb ram，最低809.带250gb硬盘和win7，再贵55元。
下面是x 5690的link，
http://www.ebay.com/sch/i.html?_from=R40&_sacat=0&_nkw=t7500+2+
功率高是高点，但是正好往冬天走，房间里暖和。如果做分布式计算，渲染，不用到
AVX，这货太强了。买回来记得清理一下散热片，重新涂个硅脂，电脑要安静好多。
觉得这的这消息有用的兄弟，买了的话送我100个伪币吧

t*****z
发帖数: 1598

来自主题: Hardware版 - 现在入双路工作站可以考虑2011平台了。

现在Xeon E5-2600(v1, Sandy Bridge，LGA2011)越来越便宜了，比1366贵不了多少了
。如果自己攒机器，现在可以考虑了。尤其是对应的二手整机（Dell T7600、HP
Z820等）现在还不便宜，所以你心理上不会觉得攒机贵。
比如这Intel的双路大主板，好几道16x的PCIe3.0，SATA3和SAS俱全，一堆USB端口，只
要200美元了。(eBay：131609027818）
CPU，E5-2670只要$270 obo了（161846187311），E5-2680也只要$340了（
161849895641），都是八核心的高端货。
内存：DDR3-1600 REG现在也不算贵了，比如这8x8=64GB的只要$350 obo（
221909181556）。
其他配件跟平台无关，不管1366还是2011甚至2011v3都得花这么多钱。一般来说300美
元内可以搞定（机箱、电源、散热、低端显卡）。
2011平台（Sandy Bridge）之于1366平台（Westmere）：核心数8比6，缓存20比12MB，
总线8.0比6.4，内存通道4比3，内存频率... 阅读全帖

m*****n
发帖数: 3644

来自主题: Hardware版 - 现在入双路工作站可以考虑2011平台了。

问一个。如果不支持新指令集AVX，2011的低频单核和1366的高频单核比较，性能有提
高么？

m*****n
发帖数: 3644

来自主题: Hardware版 - 那个ThinkCentre就一个i7-2600, 有啥可搞的, 不明白了

这电脑买回来就用性能杠杠的，秒杀所有的主流笔记本。
只要不用到一些新指令集AVX什么的，不要说上网看电影，就是做科学计算都不输主流4
核i7多少。

z*********e
发帖数: 10149

来自主题: Hardware版 - 有人把Core i3-6300超到6.27GHz, AMD 还能说完灭i3全家么？

there are huge hugs with skylake nonk oc. avx is not working, l1 and l2 run
at low speed

z*********e
发帖数: 10149

来自主题: Hardware版 - 按摩店的游戏性能

不会是专门找avx/fma什么来测的吧

z*********e
发帖数: 10149

来自主题: Hardware版 - 按摩店的游戏性能

不会是专门找avx/fma什么来测的吧

d******a
发帖数: 32122

来自主题: Hardware版 - 它配备了全新的AMD Radeon Vega显卡

它的处理器标配8核心Intel Xeon，另外还有10核心以及最高可配置的18核心36线程处
理器版本可选，二级缓存容量翻两倍，AVX指令集宽度翻倍。同时它配备了全新的AMD
Radeon Vega显卡，16GB HBM2显存，2048-bit位宽，32位浮点性能最高11TFlops。内存
方面也十分强大，标配32GB DDR4-2666，支持ECC，最大能扩展到128GB；硬盘标配1TB
SSD，最大4TB，而且可选双硬盘。
这款产品售价为4999美元起步，约合34008元，将于今年12月上市。

T****O
发帖数: 407

来自主题: Hardware版 - Dell E4300 laptop 给力

老机器老芯片其实啥都好，最大的毛病是指令集太老了。C2D没有AVX，AES等等，稍微
先进一点的软件就不支持了。C2D也不支持VT-d，就这一条，新一点的虚拟机都没法发
挥性能。

d********g
发帖数: 10550

来自主题: Linux版 - Arch软件包维护人员压力之大，常人无法想像的

很多是上游的bug，Arch由于用得早，一般是最早让问题暴露的distro，也修得最快
像glibc 2.15有个AVX的bug，Xen虚拟机会kernel panic。也是Arch最早发现的
CentOS就别指望了，6.2还在用glibc 2.12，要等它来发现2.15的bug，等100年吧

t****t
发帖数: 6806

来自主题: Programming版 - 震惊：java 的矩阵操作比 c++ 快？

如果是native的, 很好理解啊, 有AVX支持了嘛, 正常的x64应该是enable到SSE3

r*****3
发帖数: 143

来自主题: Programming版 - 《Intel® 64 and IA-32体系结构：软件开发人员手册》文字版[PDF]

中文名: Intel® 64 and IA-32体系结构：软件开发人员手册
原名: Intel® 64 and IA-32 Architectures Software Developer's Manual
作者: Intel Corporation
资源格式: PDF
版本: 文字版
出版社: Intel Corporation
书号: 25462-042US
发行时间: 2012年03月
地区: 美国
语言: 英文
简介:
汇编语言和高级语言的最根本的区别在于：在汇编语言中，程序员必须掌握数据存储和
机器相关的大量细节。与高级语言相比，在声明和移动数据时，汇编器给了程序员极大
的自由。汇编器只进行很少的错误检查，但却提供了大量的操作符和寻址表达式，使程
序员几乎能够做任何事情。然而，这种自由是必须付出一定代价的。这种代价就是在开
始编写有意义的程序之前，开发人员必须掌握大量的细节知识。因而这也是《Intel&
reg; 64 and IA-32 Architectures Software Developer's Manuall》一书的功能所在。
目录:
Volum... 阅读全帖

t*****t
发帖数: 52

来自主题: Programming版 - int这种类型的存在意义是什么？

现在int比double慢，见intel AVX的int乘法、除法指令和double的乘除法指令最小周
期数。
int比起float的好处就是精度有保障，因为存的是准确值，精度不多不少就是1.

FPU

T********i
发帖数: 2416

来自主题: Programming版 - 魏老师聊聊FPGA吧

另外，GPU对我来讲没啥用。关键还是IO瓶颈。等你把数据放到GPU memory里面，已经
实现毫秒级延迟了。
SSE/AVX加速我倒是手工写过。简单矩阵运算快了好几倍，还是值得的。

T********i
发帖数: 2416

来自主题: Programming版 - 看了那个招聘的帖子，自觉需要把 atoi温习一下。赶紧的

别说，这个gpu, SSE，AVX之类的，我还真玩过。
而且手工写的code每天都在跑。
在你身上浪费时间真不值。

k*******d
发帖数: 1340

来自主题: Programming版 - 为什么好多ID 见到 c++就好象不共戴天呢？

You are right, derivatives pricing is one place where C++ is necessary as I
mentioned in 42nd floor. But
usually only the core library, which is used together with front end system
(GUI, reporting, etc) written in Java or Python.
I think the reason that C++ is necessary is because (1) legacy codes are in
C++ and most experienced quants only know C++ (2) C++ is easier to hook up
with HPC techniques like GPU/AVX/OpenMP, etc, as well as linear algebra
libraries. (3) It is computational heavy and th... 阅读全帖

k*******d
发帖数: 1340

来自主题: Programming版 - 为什么好多ID 见到 c++就好象不共戴天呢？

You are right, derivatives pricing is one place where C++ is necessary as I
mentioned in 42nd floor. But
usually only the core library, which is used together with front end system
(GUI, reporting, etc) written in Java or Python.
I think the reason that C++ (but not Java/ C#) is necessary is because (1)
legacy codes are in
C++ and most experienced quants only know C++ (referring to high level
compiled language like C++, Java, C# here, of course one can know lots of
scripting language Python/Perl... 阅读全帖

G**Y
发帖数: 33224

来自主题: Programming版 - openblas怎么比base blas还慢呢？

自己瞎编了一次openblas，没快多少似乎还有bug （运算结果不对）
决定放弃了。Intel的MKL有免费的吗？
我比了一天，根据binary的情况：
小矩阵运算（20x20之类的），base往往最快。矩阵大了以后atlas和openblas就快很多
了。
但是openblas的multi thread很慢。（我用R测试的，我的R可能是单线程的）。
我的程序刚好是大量的小矩阵，似乎这些NB的blas也没用。
另外我在virtualbox里面跑，不支持AVX。
这东西折腾起来太费劲了。我还是再等等算了。

T********i
发帖数: 2416

来自主题: Programming版 - goodbug劝你一句，不作不死

这个人蠢，搞不清楚状况。
其实有票必须出这点上我确实故意在占便宜。
至于是不是有票？就是要找到a-b一直都一个座位空着，这个甚至能够AVX指令优化。

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

topics

未名新帖统计// 7月16日

历史上的今天