AMD 新CPU好像测试结果还不错啊



  • 最近AMD Ryzen 3系CPU出来了,感觉测评效果还不错,CPU Benchmark网站上的结果看单CPU 3900X居然能超 铂金8176 排第一了。而且说浮点单元增加了一倍,双精度的测试数据也很好,有没有大佬测试一下CFD的!

    cd163d68-84bf-4563-b626-0cb274c939f4-image.png
    6b10e0bb-5354-41e7-adda-2a2eaf65ab9e-image.png
    0f552be5-f403-443e-aacf-6c9529e4bddf-image.png
    67c37459-4159-4f23-b832-a5a605a8e567-image.png



  • 我刚入手了3900X,,,等两天后 换个阿萨辛风冷后,,再来和实验室 工作站对比对比 计算速度 嘻嘻:quwan:



  • @红豆沙 快上结果啊!
    话说今天在cupbenchmark 上看到农企的7742跑分已经是intel家最高端的1.5倍还多了,intel要努力了

    26d262e4-fe81-46e1-b765-8d44e275a0eb-image.png



  • 最近想趁双十一升级下电脑,有点想换amd,不过还在犹豫



  • AMD YES



  • @hurricane007 感觉 我算 速度很YES,不过我作为单机的计算,网格数量 在百万级以下的瞬态计算,速度和 至强金银牌差不多,,最后,,还是很吃内存的多通道的,,而且 多线程感觉优势 有些,,所以 在 我认为在大型计算前,,才能发挥出,主频和架构优势 ,



  • 要是 谁买U ,我还是 AMD YES,,,,没问题,,算东西



  • @红豆沙 可以用motorbike做个并行测试么?类似这个 http://www.cfd-china.com/topic/1909

    OpenFOAM-6下simpleFoam的motorBike算例,直接./Allrun运行,注意将decompose分解选择了scotch

    测试几个不同核心并行的clockTime



  • @红豆沙 顺便说一下啊,,我的计算因为网格少,,且瞬态每个时间的迭代次数少,,所以感觉速度差不多,并行超过4核后,速度基本变化不大了,但是 个人直觉,3900X,就以主频来说,我可以调电压到1.3V超到4.2G,主频比志强的肯定要强,,我们实验室 刚刚看了是银牌4110 记错了,,哈哈,还有个2643V4,,其余的也不说了 差不多配置,,感觉让我算起来速度差不多,,AMD高主频优势体现不出来,可能和我的计算也有关,但是 多线程下,,有那么感觉 快些,,对比是

    再者,人说INTEL和AMD的数学库,虽然Intel占优,但我们基本估计用不到那么多,可能这个优势也就不叫优势了,,这个要看U,估计得上 稍微大点的计算,,结果才可靠呢,,我这电脑 暂时 没装双系统,只是用的虚拟机,,可以试试 这个模拟 @东岳

    再者性价比高呀,啊哈哈哈,,配下来 才刚刚1W出头的电脑,,主板还是 ROG的,,性能也是刚刚的,,你就挡不住便宜啊 全货京东,配下来 配件什么的 也很放心,,加装个显卡,,还能打打游戏 ,,,



  • @piteqiu 换了 AMD 记得 别上水冷(水冷漏液啥的 不放心) 也别 用原装风冷,,直接上 顶级风冷(我的是阿萨辛3),机箱买好,风道构建好,,,温度 压得死死的,,,原装 压不住的,,单烤FPU 秒上 95,,十几秒往100上走了,,,





  • @东岳 下不动,下了好多次的说,每次都失败了,,最后 我借了个VPN下下来了,,



  • @东岳 在开启超线程下,24核全开,snappyHexmesh时间:52.89s,,simpleFoam时间:2:59.85s,,,再试试开超线程情况下12核,snappyHexMesh时间:48.07s,,simpleFoam时间2:33.38s,,,下次 在BISO里把超线程关了再看看时间,



  • @红豆沙 求解时间 和你上次做的测试看,,网格时间表现好,,求解时间,达到了213s,有点彪啊



  • @红豆沙 说错了 说错了 最简单的加减 哈哈哈 2分多 就是153s多



  • @hurricane007 有具体结果了 你可以看看哈,,,,6核,12核,超线程24核,6核是59.8s和165s



  • @红豆沙 12核比6核快不了太多?好神奇啊……



  • @hurricane007 @东岳 这估计 在6核的时候,就达到了 需要的计算资源,剩下的就交给信息交换,,也就是跟内存这边有关了,,所以 你就算涨到12核,,有内存拖后腿,,你还是得用这么些时间。,,,所以数值计算 内存速度影响挺大的,,例如,,同样16G,,肯定28两个条子的,比116的条子速度快。。

    估摸着也还有啥别的影响原因,,总得来讲,,

    应该 这个计算6核就可以喂饱了,因为计算不光是CPU在这屋里哇啦的 一顿埋头苦干,也还得有进出交换信息啥的,,一来一去也就是,,就像你往屋里搬砖,6核一人搬4页砖,12核一人搬2页砖或者有人搬多有人搬少,但是这个门就这么大,一次最多允许你搬24页砖,,所以,你就算拉上12核也发挥不出来他的实力了。

    不知道 我这样说对不对 哈哈:papa: :papa: 有没有电脑大神来指教下



  • 农企的新HEDT 平台TR 3970X也出来了,AMD yes就对了。。。有没有大佬上这个处理器试试的。。。
    https://www.expreview.com/71752.html



  • @红豆沙 同样的code,用128个核并行计算,在因特尔的服务器上算的好好的,放在AMD搭建的cluster上就发散……简直是玄学,也不知道是因为mpi库的问题还是因特尔和AMD的区别。AMD稳定性真是差太多了



  • @红豆沙 6核能跑59.8/165 , 12核是48/153,真是猛,我的9750H 用6核跑出来的是 74/251。看来笔记本U真不是降频这么简单,难道连浮点单元也砍了???
    不过喂饱的问题,我在服务器上试了下,感觉6核还是喂不满的,12核和24核比6核都有很大提升
    snappyHexMesh, 6C: 99.52 s;12C: 71.93 s;24C: 59.36s
    simpleFoam,6C: 237 s;12C: 158 s;24C:86s,
    然后想了下3900X的构架,12C分别在两个CCX上,应该是1个CCX 6个核心,如果就跑6C估计就正好分配给一个CCX上的单元所以更快,如果12C了,中间靠I/O核心通信,估计这个延迟会大一些?或者是因为超线程没关所以部分还在超线程的上面跑(类似并不是所有物理核心都被利用起来了,这种情况关掉超线程应该能提高)?或者因为AMD刚出来的时候驱动优化还不够?因为我之前看到过说Win10和 AMD两个通信好像有点问题导致某些东西没能运行在最快的核心上,你有没有装新的驱动再试试?
    我倒是觉得对这个计算来说,内存通信和IF通信都不应该是瓶颈,毕竟网格数量还是比较少的。。。



  • @白礼耕 那不会是 因为搭建的平台的问题么,,我不懂,但觉得不会是U的问题吧



  • @hurricane007 感觉到了你的豪气,,你怎么那么多计算资源 哈哈哈



  • @红豆沙 并没有。。。我们这边很神奇,几个学校的cluster是共享的,有各种CPU,5118,6142,EPYC 7501什么乱七八糟的,还有V100加速卡,然而我自己实验室给的一台破E5450,自己买了台Y540 打游戏。。。


Log in to reply