CFD中文网

    CFD中文网

    • 登录
    • 搜索
    • 最新

    服务器算的慢怎么排查

    OpenFOAM
    4
    18
    867
    正在加载更多帖子
    • 从旧到新
    • 从新到旧
    • 最多赞同
    回复
    • 在新帖中回复
    登录后回复
    此主题已被删除。只有拥有主题管理权限的用户可以查看。
    • S
      shrine 最后由 编辑

      算interFoam
      自己电脑上分成8个线程,一天能算个1000s左右,放到服务器上分成两个节点64线程,一天只有几十秒

      C 1 条回复 最后回复 回复 引用
      • C
        cccrrryyy 教授 @shrine 最后由 编辑

        @shrine 同一台服务器虚拟成2个节点?

        I don't want to survive, I want to thrive.

        S 1 条回复 最后回复 回复 引用
        • S
          shrine @cccrrryyy 最后由 编辑

          @cccrrryyy 是的

          C 1 条回复 最后回复 回复 引用
          • C
            cccrrryyy 教授 @shrine 最后由 编辑

            @shrine 为什么要虚拟成2个节点,这样肯定严重影响速度的,直接并行跑不跨节点就不会这样了。

            I don't want to survive, I want to thrive.

            S 1 条回复 最后回复 回复 引用
            • bestucan
              bestucan 版主 副教授 最后由 编辑

              这个贴子里提的 gotop

              可以排查

              滚来滚去……~(~o ̄▽ ̄)~o 滚来滚去都不能让大家看出来我不是老师么 O_o

              异步沟通方式(《posting style》from wiki)(下载后打开):
              https://www.jianguoyun.com/p/Dc52X2sQsLv2BRiqnKYD
              提问的智慧(github在gitee的镜像):
              https://gitee.com/bestucan/How-To-Ask-Questions-The-Smart-Way/blob/master/README-zh_CN.md

              1 条回复 最后回复 回复 引用
              • 李东岳
                李东岳 管理员 最后由 编辑

                @cccrrryyy 我都不知道有虚拟节点这种神操作

                CFD高性能服务器 http://dyfluid.com/servers.html

                C 1 条回复 最后回复 回复 引用
                • S
                  shrine @cccrrryyy 最后由 编辑

                  @cccrrryyy 在 服务器算的慢怎么排查 中说:

                  会这样了。

                  单位的机子,分给多个用户,每个用户用1到两个节点

                  C 1 条回复 最后回复 回复 引用
                  • C
                    cccrrryyy 教授 @李东岳 最后由 编辑

                    @李东岳 找第三方测试的时候偶然发现的,我自己也不会搞,但发现居然有这种神奇的操作:chitang:

                    I don't want to survive, I want to thrive.

                    1 条回复 最后回复 回复 引用
                    • C
                      cccrrryyy 教授 @shrine 最后由 编辑

                      @shrine 那你分到的两个节点至少不能在一台物理机上,这个估计运维管理人员应该能做到吧?不然还不如独占一台物理机,不要跨节点了。

                      I don't want to survive, I want to thrive.

                      S 3 条回复 最后回复 回复 引用
                      • 李东岳
                        李东岳 管理员 最后由 编辑

                        @shrine 在 服务器算的慢怎么排查 中说:

                        单位的机子,分给多个用户,每个用户用1到两个节点

                        听起来像是一台几十核的台式机。分给了很多用户来用。现在服务器很便宜,老铁赶紧跟单位说换一个吧。即使机架式,便宜的10多万都下来了。:baobao:

                        CFD高性能服务器 http://dyfluid.com/servers.html

                        S 1 条回复 最后回复 回复 引用
                        • S
                          shrine @cccrrryyy 最后由 编辑

                          @cccrrryyy 所以说,如果跨节点在一台物理机上没有问题?如果不在一台物理机子上就会出现我的问题?

                          还是

                          无论在不在一台物理机上,跨节点都会很慢?

                          1 条回复 最后回复 回复 引用
                          • S
                            shrine @cccrrryyy 最后由 编辑

                            @cccrrryyy 问过了,一台服务器一个节点

                            1 条回复 最后回复 回复 引用
                            • S
                              shrine @李东岳 最后由 编辑

                              @李东岳 一个集群

                              1 条回复 最后回复 回复 引用
                              • S
                                shrine @cccrrryyy 最后由 编辑

                                @cccrrryyy 怀疑是版本的问题,前面运维安装of9 8都没成功,后来安装了2112,不知道什么版本

                                另外在自己机子上,编译weno也是不成功,也是换成2112就好了

                                现在发现2112上输出比of9多很多,不知道是不是这个原因导致的

                                今晚放到自己机子上用2112跑跑看

                                C 1 条回复 最后回复 回复 引用
                                • C
                                  cccrrryyy 教授 @shrine 最后由 编辑

                                  @shrine 版本不应该吧?不知道你说的“输出多很多”具体是指什么,按道理IO不会影响速度到你说的这种程度。

                                  同一个物理机虚拟出两个节点,然后用这两个节点跑并行,大概率会很慢很慢。如果是一台物理机一个节点,别的也都没问题,那只能是网络原因了,但就算千兆网也不至于慢到你说的程度。有运维让运维好好儿查查吧,网络的硬软件啥的。

                                  I don't want to survive, I want to thrive.

                                  S 1 条回复 最后回复 回复 引用
                                  • S
                                    shrine @cccrrryyy 最后由 shrine 编辑

                                    @cccrrryyy 在自己电脑上用of2112版本算了,跟服务器上速度在一个数量级,应该就是版本问题了。这就麻烦了,of789服务器根本装不上去。

                                    C 1 条回复 最后回复 回复 引用
                                    • C
                                      cccrrryyy 教授 @shrine 最后由 编辑

                                      @shrine 听起来太诡异了,还没碰到过这种情况。你是有什么特定的模块要用么,可以尝试把它放到2112里面编译看看行不行,印象中如果不涉及特别底层的东西编译起来也不是很麻烦。

                                      I don't want to survive, I want to thrive.

                                      S 1 条回复 最后回复 回复 引用
                                      • S
                                        shrine @cccrrryyy 最后由 编辑

                                        @cccrrryyy 让运维换了个of2106版本,速度有所提升,相当于自己电脑的四分之一速度,离期望值还是低点

                                        1 条回复 最后回复 回复 引用
                                        • First post
                                          Last post