由买买提看人间百态

topics

全部话题 - 话题: sse4
1 (共1页)
d*****0
发帖数: 68029
1
3日上午,威盛公司正式公布了6款Nano3000系列新款处理器,并宣称该系列新款处理器
比以往的Nano1000/2000系列产品“性能提升20%,而功耗则下降20%”。Nano3000系列
处理器仍然沿用现有的64位Isaiah架构,不过内部加入了对SSE4扩展指令集以及硬件虚
拟化技术的支持。
Nano3000系列处理器仍然沿用现有的64位Isaiah架构,不过内部加入了对SSE4扩展指令
集以及硬件虚拟化技术的支持。另外,新款处理器的频率也有所提升,而功耗则进一步
下降,据此猜测,该系列新款处理器可能采用了比前代处理器的65nm制程技术更为先进
的制程进行制作,不过威盛的官方文件中并没有对新处理器的制程技术作详细切实的说
明。(谷歌搜索的结果显示Nano3000仍然采用的是65nm制程技术制作,代工厂商则仍为
富士通。)
据威盛称该系列处理器的TDP功耗只有1.7W,还表示Nano3000核心内部将集成高清视频
解码回放加速器,可以对1080p H.264视频格式进行加速.
另外,Nano3000处理器与旧款Nano1000/2000以及C7/C7M/Eden等系列处理器保持针脚
g******z
发帖数: 5809
2
来自主题: shopping版 - 为啥你们这么喜欢i5的cpu
提升的SSE4.2
SSE4指令集被认为是2001年以来Intel最重要的指令集扩展,包含54条指令。
Intel在Penryn处理器中加入了对SSE4.1的支持,共增加了47条新指令,提升了处理器
在图形、3D图像与游戏、视频编码与影音处理等方面的性能表现。本次在Nehalem处理
器中,进一步支持了SSE4.2指令集。SSE4.2完整的实现了SSE4指令集,相对于SSE4.1加
入了7条新指令。
SSE4.2指令集
SSE4.2新加入的几条新指令有两类。第一类是字符串与文本新指令STTNI,STTNI包
含了四条具体的指令。STTNI指令可以对两个16位的数据进行匹配操作,以加速在XML分
析方面的性能。据Intel表示,新指令可以在XML分析方面取得3.8倍的性能提升。第二
类指令是面向应用的加速指令ATA。ATA包括冗余校验的CRC32指令、计算源操作数中非0
位个数的POPCNT指令,以及对于打包的64位算术运算的SIMD指令。 CRC32指令可以取代
上层数据协议中经常用到的循环冗余校验,据Intel表示其加速比可以达到6.5~18.6倍
;POPCNT用于
C******s
发帖数: 813
3
来自主题: ebiz版 - 放包子问Gateway I5 CPU

处理器
处理器: 英特尔 Core i5 M 430 @ 2.27GHz 笔记本处理器
核心: Arrandale (32 纳米) / 核心数: 4
插座/插槽: Socket uPGA-989
速度: 2.27 GHz (133 MHz x 17.0)
一级代码/数据缓存: 2 x 32 KB, 8-Way, 64 byte lines / 2 x 32 KB,
4-Way, 64 byte lines
二级缓存: 2 x 256 KB, 8-Way, 64 byte lines
三级缓存: 3 MB, 12-Way, 64 byte lines
特征: MMX, SSE, SSE2, SSE3, SSSE3, SSE4.1, SSE4.2, HTT, EM64T,
E
t**t
发帖数: 27760
4
来自主题: Hardware版 - i5 670超到了7.0G
http://valid.canardpc.com/show_oc.php?id=928132
CPU Arch : 1 CPU - 2 Cores - 2 Threads
CPU PSN : Intel Core i5 CPU 670 @ 3.47GHz (ES)
CPU EXT : MMX SSE SSE2 SSE3 SSSE3 SSE4.1 SSE4.2 EM64T VT-x AES
CPUID : 6.5.2 / Extended : 6.25
CPU Cache : L1 : 2 x 32 / 2 x 32 KB - L2 : 2 x 256 KB
CPU Cache : L3 : 4096 KB
Core : Clarkdale (32 nm) / Stepping : ???
Freq : 7002.66 MHz (259.36 * 27)
MB Brand : EVGA
MB Model : EVGA P55 3X SLI E658
NB : Intel Havendale/Clarkdale Host Bridge re
SB : Intel P55 rev 04
G
r*a
发帖数: 1503
5
非常感谢! 电源,显卡有什么可以推荐和它搭配的嘛?
这里就是400块的那个组合。
MSI P67A-C43 B3 Intel P67 Motherboard
Processor Socket: Intel
Processor Interface: LGA1155
Form Factor: ATX
Processors Supported: 2nd generation Intel® Core™ i3
2nd generation Intel® Core™ i5
2nd generation Intel® Core™ i7
Additional Technologies: THX TruStudio PRO
MSI ClickBIOS
Military Class II
OC Genie II
Northbridge: Intel® P67 Express
Memory Supported: DDR3 1333MHz
DDR3 1066MHz
DDR3 1600MHz (... 阅读全帖
s***c
发帖数: 1926
6
来自主题: Hardware版 - 高富帅的选择: Intel Xeon E3-1220
Xeon E3-1220就是一块没有内置显卡的i7 处理器, 4核4线程。功耗比i7低,体质比i7
好。普通LGA 1155主板都可以使用,售价却和i5 相当,真是一颗名副其实的高富帅CPU。
Ivy Bridge版本据说更好。强烈推荐!
说明:1220不支持超线程,1230是4核8线程。
Core Sandy Bridge
Multi-Core Quad-Core
Name Xeon E3-1220
Operating Frequency 3.1GHz
L2 Cache 4 x 256KB
L3 Cache 8MB
Manufacturing Tech 32 nm
64 bit Support Yes
Hyper-Threading Support No
Virtualization Technology Support Yes
Multimedia Instruction MMX, SSE, SSE2, SSE3, SSSE3, SSE4.1, SSE4.2, AES, EM6
4T
Thermal Design Power 80W
j*******n
发帖数: 10868
7
来自主题: Military版 - AMD把x86技术授权给中国公司了
看第二段
According to AMD’s CFO commentary, the joint venture “consists of two
separate legal entities where AMD has a majority stake in one and a minority
stake in the other. AMD’s total exposure to JV losses is limited to its
investment in the JV. As of March 26, 2016 our investment in the JV was $0.”
This suggests that the JV is structured to bypass restrictions in AMD’s x86
license agreement with Intel that would otherwise prevent the company from
signing any such agreement. Lisa Su also noted t... 阅读全帖
f***y
发帖数: 4447
8
科技日报讯(记者申明)“兆芯处理器的整体性能已经能够对标国际主流标准,以ZX-C
系列CPU及KX-5000为例,已经可以对标Intel第六代i3处理器,主机频率可以达到2GHz
,对于日常办公应用、4K解码,甚至运行使命召唤、古墓丽影等主流3D游戏已经毫无压
力。”近日,上海兆芯集成电路有限公司副总经理罗勇博士在接受记者采访时表示。
高端通用CPU是计算机、服务器的核心,同时也是集成电路行业最富有技术含量的产品
之一,更与网络信息安全密切相关。
罗勇表示,兆芯在发展国产x86解决方案的道路上,始终秉持着“自主可控、兼容主流
和产业完备”的发展目标。兆芯是目前国内唯一同时掌握中央处理器、图形处理器和芯
片组三大核心技术的公司,在自主可控方面,兆芯拥有一支由大陆本土人才构成的完整
的研发团队,全面掌握着x86解决方案全平台实现技术,并且自主构建了全流程设计规
范、设计标准,以及处理器芯片实现的全部环境。研发团队不仅掌握了x86处理器开发
的完整代码,更具备完全自主的IP开发能力。
此外,兆芯国产自主可控通用处理器全面兼容x86指令,并支持CPU虚拟化技术,能稳定
、流畅运行全系列Wind... 阅读全帖
f***y
发帖数: 4447
9
罗勇透露,兆芯下一代开先KX-6000系列处理器已成功流片,其基于更先进的16nm工艺
,主频高达3.0GHz,兼容x86指令集及SSE4.2、AVX2等扩展指令集。
f***y
发帖数: 4447
10
除了AMD授权的海光集团在开发X86处理器之外,国内还有另一个阵营开发X86处理器,
那就是上海兆芯,他们是跟VIA威盛合作的。
日前上海兆芯副总经理在采访中表示兆芯处理器的整体性能已经能够对标国际主流
标准,最新处理器已经可以对标英特尔的第六代Corei3处理器,运行主流游戏无压力,
而下一代兆芯X86处理器性能看齐英特尔Corei5处理器。
科技日报报道称,上海兆芯集成电路有限公司副总经理罗勇博士在接受记者采访时
表示"兆芯处理器的整体性能已经能够对标国际主流标准,以ZX-C系列CPU及KX-5000为
例,已经可以对标Intel第六代i3处理器,主机频率可以达到2GHz,对于日常办公应用
、4K解码,甚至运行使命召唤、古墓丽影等主流3D游戏已经毫无压力。"
国产处理器对标英特尔Corei3处理器的说法不是第一次出现,2017年同样是科技日
报报道了国内核高基项目十多年来的进展,其中提到飞腾、龙芯、申威和兆芯等国产
CPU的单核性能从"十二五"初期不到Inteli3CPU的10%分别提升到36.4%、33.3%、25.8%
和51.5%。
这里面性能接近Corei3一半性能的依然是... 阅读全帖
f*******u
发帖数: 76
11
by the way, you can also mention that the instruction POPCNT in x86 SSE4 can
do it by hardware.
f*******u
发帖数: 76
12
来自主题: NextGeneration版 - 吓死人的30岁生日
by the way, you can also mention that the instruction POPCNT in x86 SSE4 can
do it by hardware.
g******z
发帖数: 5809
13
来自主题: shopping版 - 为啥你们这么喜欢i5的cpu
Nehalem内核与之前Intel所发布的处理器的内核相比,在以下部分进行了改进:支持新
的SSE4.2指令集、具有更深的缓冲器、支持SMT、对虚拟化进行了改进、对分支预测进
行了改进、增强了对循环的处理、增加了高速缓存的层次、改进了原语支持等等。
上图展示了Nehalem的流水线。了解Conroe微体系结构的读者可以看到,右上角非核心
部分包括的QPI、三通道内存控制器、三级高速缓存都是之前Intel的处理器中所没有的
。此外核心部分Nehalem与之前的Penryn也有诸多不同。让我们来一起剖析Nehalem的设
计,我们先来关注流水线的前端部分。
小贴士:
很多朋友还不清楚什么是流水线以及流水线的具体作用。为了方便大家阅读,在此
进行一些说明。让我们考虑这样一个例子。假如你家旁边开了一家洗衣房,而你有一筐
衣服要洗。洗衣房洗衣服可以分为以下几个步骤:在前台登记并收取衣物、洗衣、晾干
、熨烫。完成同样的事情可能有两种做法。第一种是前一个顾客在前台登记完成并洗完
衣服,晾干、熨烫都完成以后你才能登记。这种做法既相当于流水线处理器出现之前的
微处理器的处理方式。第二种方式是前一
g******z
发帖数: 5809
14
来自主题: shopping版 - 为啥你们这么喜欢i5的cpu
还有五页,未完待续
----
# 第6页:高速缓存结构与性能的重大变化
# 第7页:二级TLB的加入与同步原语
# 第8页:内存控制器与QPI 服务器的新期望
# 第9页:SSE4.2与提升的虚拟机性能
# 第10页:门控电源与Turbo Mode
f*******u
发帖数: 76
15
by the way, you can also mention that the instruction POPCNT in x86 SSE4 can
do it by hardware.
f*******u
发帖数: 76
16
来自主题: paladin版 - 骑士的血脉 15 上
by the way, you can also mention that the instruction POPCNT in x86 SSE4 can
do it by hardware.
f*******u
发帖数: 76
17
by the way, you can also mention that the instruction POPCNT in x86 SSE4 can
do it by hardware.
f*******u
发帖数: 76
18
by the way, you can also mention that the instruction POPCNT in x86 SSE4 can
do it by hardware.
f*******u
发帖数: 76
19
by the way, you can also mention that the instruction POPCNT in x86 SSE4 can
do it by hardware.
f*******u
发帖数: 76
20
by the way, you can also mention that the instruction POPCNT in x86 SSE4 can
do it by hardware.
f*******u
发帖数: 76
21
by the way, you can also mention that the instruction POPCNT in x86 SSE4 can
do it by hardware.
a*o
发帖数: 19981
22
这啥烂bug?为啥好多文章都来这么一出?
发信人: fancieryu (Breeze), 信区: paladin
标 题: Re: 有什么好方法找int的binary表示里面1的个数?
发信站: BBS 未名空间站 (Sun Apr 4 23:15:19 2010, 美东)
by the way, you can also mention that the instruction POPCNT in x86 SSE4 can
do it by hardware.
f*******u
发帖数: 76
23
来自主题: HuNan版 - 挖个小坑: 你赞成换偶吗?
by the way, you can also mention that the instruction POPCNT in x86 SSE4 can
do it by hardware.
a****a
发帖数: 5763
24
http://bbs.weiphone.com/read-htm-tid-556999.html
上篇讲到OpenCL的好处, 但是如果要让Mac用户的日常应用切实的体验到这些优势和影
响, 就需要程序员把OpenCL技术加入到他们的程序中去. 而历来, GPGPU的编程语音一
直没有在传统的桌面程序中得到广泛的应用. 这当中有几个原因.
最初, 针对GPU的编程需要用汇编语言, 而汇编语言跟传统用于桌面程序开发的语言的
差别很大. 在桌面程序的开发上, 广泛应用GUI, API等工具. 即使后来出现的类似C语
音的一些编程语言, 保留了一些针对图形的特性. 但大部分的开发者对于这部分东西仍
然感到很头痛, 像一门他们不太懂的外语一样避而远之.
其次, 即使使用GPU能在很大程度上提高速度, 但依赖于GPU来进行通用计算还是一个问
题, 就是会让程序本身的兼容性变得比较狭窄. 很多老款的GPU, 特别是笔记本上的,
无法运行像CUDA这样的语言.
而苹果在设计OpenCL的时候,有一个很关键的决定就是要让OpenCL不仅能运行在GPU上,
而且还要运行在CPU上. 一个OpenCL程序... 阅读全帖
b******t
发帖数: 965
25
来自主题: Hardware版 - Intel正式发布16款45nm处理器
http://news.mydrivers.com/1/94/94583.htm
Intel正式发布16款45nm处理器
驱动之家[原创] 作者:上方文Q 编辑:上方文Q 2007-11-12 09:58:21 2279 人阅读
[投递]
就当我们还沉浸在周末的快乐中时,Intel已经正式发布了其首批45nm工艺Penryn核心
处理器,包括一款发烧级桌面型号和15款服务器型号,主流著名型号和笔记本型号则将
在明年一季度推出。
Intel联合创始人之一Gordon Moore称这是近40年来晶体管技术最大的一次进步。新处
理器首次应用了以铪(Hafnium)为基础的High-K金属栅极技术,并在业界首次采用 45nm
工艺制造,从而提高性能、降低功耗。新处理器集成的晶体管数量相比65nm型号增加了
将近一倍,比如四核心高达8.2亿个,但凭借新技术,芯片的核心面积却平均减小了25
%,性能每功耗指标同时提升38%。
此外,Intel还加入了47条新的SSE4指令集,用于视频编码、高清播放、照片处理、HPC
和企业应用,并得到了微软、赛门铁克、Adobe的支持。增强虚拟化技术、Radix
d****n
发帖数: 12461
26
来自主题: Hardware版 - Athlon II X2 250 vs E8400
以后多媒体方面还是靠sse4吧。sse3老了,四核也没有用。
N****w
发帖数: 21578
27
内部将集成高清 这个猛。。。
希望打破 Intel 封锁多出货。。。Nano 几乎就没看到有卖的。。。
d*****0
发帖数: 68029
28
nano放卫星放得太厉害了,到现在还是65nm制程,效率跟atom恐怕还是没法比
t****g
发帖数: 35582
29
要是真好用怎么会封锁的住。
y****o
发帖数: 3575
30
对,intel其实就是在效能上比其他好,弄得amd不断的推出低频cpu指望把能耗降下来。
t**t
发帖数: 27760
t**t
发帖数: 27760
l*********s
发帖数: 5409
33
来自主题: Hardware版 - AMD新一代的穷人法拉利
that is mainly due to SSE4; however, I think GPGPU is going to make it
irrelevant in near future.
l******n
发帖数: 1683
34
来自主题: Hardware版 - AMD确实很差
在2700K上面的性能依赖icc和mkl么? 我感觉有可能是你用的编译器和库不支持FX-8350
的AVX指令集. 如果只能用SSE4的话, 那么理论上正好差一半的性能.
l*******e
发帖数: 170
35
3rd Generation Intel® Core™ i5 Processors Previous Generation
Intel® Core™ i7 Processor
Processor Number i5-3210M i7-720QM
Launch Date Q2'12 Q3'09
# of Cores 2 4
# of Threads 4 8
Cache 3.0 MB 6.0 MB
Clock Speed 2.50 GHz 1.60 GHz
Max Turbo Frequency 3.10 GHz 2.80 GHz
Bus/Core Ratio 25 12
Bus Type DMI DMI
Instruction Set 64-bit 64-bit
Instruction Set Extensions AVX SSE4.2
Lithography 22 nm 45 nm
Max TDP 35 45
l*******n
发帖数: 635
36
实测
Processor Brief Spec Linpack (GFLOPS)
Dual Xeon E5 2687v3 20 cores @ 3.1GHz AVX2 788
Xeon Phi 3120A 57 cores @ 1.1GHz 512-bit SIMD 710
Quad Xeon E5 4624Lv2 40 cores @ 1.9GHz AVX 581
Dual Xeon 2695v2 24 cores @ 2.4GHz AVX 441
Core i7 5960X (Haswell E) 8 cores @ 3.0GHz AVX2 354
Dual Xeon E5 2687W 16 cores @ 3.2GHz AVX 345
Core i7 5930K (Haswell E) 6 cores @ 3.5GHz AVX2 289
Dual Xeon E5 2650 16 cores @ 2.0GHz AVX 262
Core i7 4770K (Haswell) ... 阅读全帖
F***Q
发帖数: 6599
37
来自主题: Hardware版 - 6700k+z170 vs 1700x+B350 选哪个?

unfortunately, windows 10. I bought it for the group as a windows remote
server. My code uses SSE4, but I suppose it is supported on both.
a**u
发帖数: 7128
38
[Parsed_ass_0 @ 0x80ae2e7a0] Glyph 0x2B2 not found, selecting one more font
for (Arial, 80, 0)
seems it is missing the fonts. How do I tell ffmpeg what font to use?
-----------------------------------
ffmpeg1 -i Farewell.mkv -sameq -vcodec libx264 -threads 26 -y -vf ass=a.
ass fare.mp4
ffmpeg version 1.0.5 Copyright (c) 2000-2012 the FFmpeg developers
built on May 28 2013 19:38:07 with gcc 4.2.2 (GCC) 20070831 prerelease [
FreeBSD]
configuration: --enable-x11grab --prefix=/usr/local --man... 阅读全帖
c*****e
发帖数: 737
39
测试了一下几种算法
gcc 4.1.2, -O2
Xeon E5335 2 GHz
64k个random integer
Winner: cost 328188
inline bool isPower(int x_)
{
register int bitpos, bitpos2;
asm ("bsr %1,%0": "+r" (bitpos):"rm" (x_));
asm ("bsf %1,%0": "+r" (bitpos2):"rm" (x_));
return (bitpos == bitpos2) && x_;
}
Second: cost 361644
就是查64k表法
bool isPower(int x_)
{
return b[x_];
}
Third: cost 405918
bool isPower(int x_)
{
return x_ && (x_ & (x_ - 1)) == 0;
}
Forth: cost 434838
int a2[] = {-1,1,2,4,8,16,32,64,128,256,512,1024,2048,40... 阅读全帖
c*****e
发帖数: 737
40
测试了一下几种算法
gcc 4.1.2, -O2
Xeon E5335 2 GHz
64k个random integer
Winner: cost 328188
inline bool isPower(int x_)
{
register int bitpos, bitpos2;
asm ("bsr %1,%0": "+r" (bitpos):"rm" (x_));
asm ("bsf %1,%0": "+r" (bitpos2):"rm" (x_));
return (bitpos == bitpos2) && x_;
}
Second: cost 361644
就是查64k表法
bool isPower(int x_)
{
return b[x_];
}
Third: cost 405918
bool isPower(int x_)
{
return x_ && (x_ & (x_ - 1)) == 0;
}
Forth: cost 434838
int a2[] = {-1,1,2,4,8,16,32,64,128,256,512,1024,2048,40... 阅读全帖
r*****3
发帖数: 143
41
中文名: Intel® 64 and IA-32体系结构:软件开发人员手册
原名: Intel® 64 and IA-32 Architectures Software Developer's Manual
作者: Intel Corporation
资源格式: PDF
版本: 文字版
出版社: Intel Corporation
书号: 25462-042US
发行时间: 2012年03月
地区: 美国
语言: 英文
简介:
汇编语言和高级语言的最根本的区别在于:在汇编语言中,程序员必须掌握数据存储和
机器相关的大量细节。与高级语言相比,在声明和移动数据时,汇编器给了程序员极大
的自由。汇编器只进行很少的错误检查,但却提供了大量的操作符和寻址表达式,使程
序员几乎能够做任何事情。然而,这种自由是必须付出一定代价的。这种代价就是在开
始编写有意义的程序之前,开发人员必须掌握大量的细节知识。因而这也是《Intel&
reg; 64 and IA-32 Architectures Software Developer's Manuall》一书的功能所在。
目录:
Volum... 阅读全帖
p***o
发帖数: 1252
42
来自主题: Programming版 - 算CRC好费CPU啊
你要是不在乎用啥多项式的话去搜搜用crc32这个sse4指令的库。
C*******g
发帖数: 82
43
From http://news1.mydrivers.com/pages/20070129105338_62199.htm
Intel详谈45nm:原生四核再等下一代
作者:上方文Q 编辑:上方文Q 2007-1-29 10:53:00
Intel最近披露了有关45nm工艺“Penryn”双核心、四核心处理器的大量细节资料,并
证实了一个令人吃惊的传言:今年第三季度的“Yorkfield”也不是原生四核心,而要
等到2008年下半年的再下一代“Nehalem”。
整整一年前,Intel成功制出了45nm工艺的SRAM芯片,完成了新工艺进程中的原型平台
;今年初,45nm Penryn的原型又成功运行了Windows XP、Windows Vista、Mac OS X、
Linux等操作系统,显示了其成熟性。
Penryn并非全新架构的产物,而是现有Core架构的工艺改进版,大体上区别不大,只是
进行了一些技术增强,比如更大容量的二级缓存、更高的主频、更好的散热、完整的
SSE4指令集、先进的high-k工艺等等。在接口上,LGA775继续沿用,现有主板基本只需
BIOS即可。
在晶体
1 (共1页)