Перейти к публикации

Сравнение скорости Fluent на 1-2-3-4 ядрах и 32 и 64 битах.


Игорь (Москва)

Рекомендованные сообщения

Добрый день!

Разжился четырехядерным компом - решил поэкспериментировать.

Итак. Начальные условия.

Intel Core2Quad 2.4 ГГц

RAM 4Гб

Fluent 6.3.26

Задача: Ступенчатое концевое уплотнение турбины. 2D.

Level Cells Faces Nodes Partitions

0 167037 338133 171052 1

16 cell zones, 169 face zones.

Поставил на комп Win XP, Win XP x64, Vista x64.

На Win XP х64, 64-х битный Флюент почему-то не запустился. Выдал сразу же ошибку. На Висте - все ОК.

Засчекал время расчета 100 итераций (мин:сек), потому что неизвестно сколько нужно для сходимости - не моя задача.

Кол-во ядер | Vista 64 | Win XP 32

-------------------------------------------

1 | 4:50 | 5:10

2 | 2:53 | 2:55

3 | 2:08 | 2:13

4 | 1:52 | 1:56

______________________________

Таким образом видим, что использование 4-х ядер ускоряет процесс в 2.6 раз, трех в 2.27, двух - в 1.68.

Далее попробовал разогнать процессор - .

Частота, ГГц | Vista 64, 4 ядра.

---------------------------

2.4 | 1:52

3.0 | 1:44

3.13 | 1:39

___________________

Выводы и фантазии.

1. Два ядра гораздо лучше одного. А три существенно лучше двух. (Привет фирме АМД с их Phenom X3!)

2. 64-х битность заметно улучшает погоду тольrо на одноядерниках - надо учесть тем, кто не пересел на Core2.

3. Частота. 30% рост частоты приводит к уменьшению времени счета на 13%. Так что многоядерность нам важней чем частота.

Перспективы.

Любопытно посмотреть как что изменится при более тяжелых задачах, на больших сетках.

Также наверное задачи вычислительной гидродинамики можно как-то классифицировать по тому насколько хорошо они распараллеливаются.

Вроде бы все.

Приветствуются комментарии, дололнения и т.п... :)

Изменено пользователем Игорь (Москва)
Ссылка на сообщение
Поделиться на других сайтах


64-битность нужна не для скорости а для больших задач (>4 ГБ, хотя это от бедности - на ядро эффективнее порядка 0.5ГБ).

Как изменится и т.п. - см. <noindex>http://www.fluent.com/software/fluent/fl5bench/index.htm</noindex> и <noindex>http://www.fluent.com/software/fluent/fl5bench/new.htm</noindex>

Ссылка на сообщение
Поделиться на других сайтах

Да.... с 64-х битностью это разумеется основное. Правда у меня пока нет таких задач - поэтому сейчас был интересен именно скоростной аспект. И хотелось именно самому пощупать - ведь те машины которые описаны на сайте Флюента обычному человеку малодоступны. А сейчас уже нечто почти суперкомпьютерное :) можно собрать и у себя на столе.

Было описание интересной системы - четыре платы с двухядерными АМД закреплены на одной стойке. Соединены гигабитным ethernet. Получилась шустрая вещь. И наращиваемая. И ДЕШЕВАЯ!

С уважением,

Игорь

Ссылка на сообщение
Поделиться на других сайтах

4хядреный от интел эффективен именно при разбиении задачи на две части, т.к. в этом случае задача может рахместиться внутри одного камня внутри кристалла. Если задача будет жить на ядрах соседних камней внутри кристалла, то будут друг с другом осуществлять обмен через оперативную память и это является его узким горлышком.

Где-то в сети валялись тесты по параллельной эфективности вычислений на камнях от Интела и АМД.

Оптерон с ростом количества ядер выше двух Зеона на лопатки кладет именно по указанной выше причине.

Поэтому пока на интелах лучше иметь два двухядерных компа. Это будет куда лучше, чем один четырехядерный.

Или на одной материнке два гнезда иметь, но только если они там не на одной шине сидят, как это у интела всегда раньше было.

Ссылка на сообщение
Поделиться на других сайтах

Перспективы.

Любопытно посмотреть как что изменится при более тяжелых задачах, на больших сетках.

Также наверное задачи вычислительной гидродинамики можно как-то классифицировать по тому насколько хорошо они распараллеливаются.

Чем больше размерность сетки, тем меньше (в процентах от общего количества) ячеек приходится на границы декомпозиционных блоков, тем эффективнее распараллеливание. Имеется даже некое исследование на эту тему. Я исследовал в том числе и свой код таким образом. Более того, во-первых, ядро можно считать отдельным процессором. Пробовал запускать задачу как на разных ядрах, так и на физически разных процессорах в пределах одного узла. Время счета не отличается. Во-вторых, на сетках высокой размерности передача данных занимает незначительное время по сравнению с объемом вычислений, то есть возможно использование низкоскоростной сети (Gigabit Ethernet) между узлами. В-третьих, значительное время занимает подготовка пересылок, ее имеет смысл посадить на отдельный процессор.

Ссылка на сообщение
Поделиться на других сайтах

Таким образом видим, что использование 4-х ядер ускоряет процесс в 2.6 раз, трех в 2.27, двух - в 1.68.

........

Приветствуются комментарии, дололнения и т.п... :)

Истинное ускорение, при расчете конкретной задачи будет несколько отличаться, от тех чисел которые вы привели.

При расчете на 2-х и более ядрах, затрачивается дополнительное кол-во итераций на сшивку решения.

К примеру если у меня на одном ядре сходимость 10-3 достигалась за 104 итерации, то на двух уже за 125, при этом выйгрыш по времени достигал 1.6

По поводу мнения Ara, передача данных и счет - операции чисто последовательные, поэтому чем больше пересылок, тем больше общее время задачи.

Ссылка на сообщение
Поделиться на других сайтах

Присоединяйтесь к обсуждению

Вы можете опубликовать сообщение сейчас, а зарегистрироваться позже. Если у вас есть аккаунт, войдите в него для написания от своего имени.
Примечание: вашему сообщению потребуется утверждение модератора, прежде чем оно станет доступным.

Гость
Ответить в тему...

×   Вставлено в виде отформатированного текста.   Вставить в виде обычного текста

  Разрешено не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отобразить как ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставить изображения напрямую. Загрузите или вставьте изображения по ссылке.

  • Сейчас на странице   0 пользователей

    Нет пользователей, просматривающих эту страницу.




  • Сообщения

    • Bot
      Компания «Топ Системы» открывает Весеннюю школу САПР 2024 — серию уроков в формате открытых вебинаров по теме «T‑FLEX CAD как часть платформенного решения T‑FLEX PLM». Когда? 22-27 апреля 2024, начало в 11.00 МСК Какой формат? ONLINE вебинары продолжительностью 2-2,5 часа Что в программе? Демонстрация экспертного опыта работы с технологиями программного комплекса T‑FLEX PLM. Опыт АЗ Урал, Борлас, НИЯУ МИФИ. Знакомство на практических примерах с функционалом и алгоритмами работы программ комплекса T‑FLEX PLM. Опыт миграции с иностранных решений на программный комплекс T-FLEX PLM. РЕГИСТРАЦИЯ Есть ограничения по участникам, требования к слушателям указаны на сайте регистрации. View the full article
    • maxx2000
      @gudstartup но тем не менее они метафорически предсказали будущее. Всё, от волшебной кнопки до разбивания черепушек молотом, просиживание у окна (Windows)  слежение за звёздами (лайки )  
    • maxx2000
      ага, привязать двойным морским узлом 
    • gudstartup
      текнология это вам не группа из 90-х
    • Клиент
      @Viktor2004 , почему второй станок делает лучше можно разбираться. Но здесь реально большой вылет фрезы, слышно как звенит. Может быть, стоит с оборотами поиграть (уменьшить или увеличить. Может быть нагрузку (съём) на фрезу больше дать. Режимы явно нетехнологичны. Судя по всему серия, над технологией поработать нужно, поставьте такую фрезу, она не дорогая:  
    • gudstartup
      @Viktor2004 вопросы к технологам при такой обработке рябь обеспечена это сильно сказано прям таки зеркало? да и ряби на фото не видно @Viktor2004 это вы рябью называете это какое-то дробление материала а не рябь притом только сверху вижу поставите это зеркало на ваш с рябью и сделайте небольшой съем и посмотрите чего зарябит и вообще чего нельзя стол повернуть и фаску продольно снять что за дикий метод
    • Viktor2004
      мне в пример приводят соседний станок. Там все то же самое, такой же вылет, такие же режимы. Но там дает зеркало
    • Leksunkin
      Вылет великоват, сделать припуск поменьше на фаску, как вариант пройти предварительно ступеньками предыдущим инструментом. Фреза похожа на сферическую, если да то лучше по кругу послойно закатать. Станок не виноват.
    • gudstartup
      ну пока еще мы вам никак не помогли но возможно удастся после изучения бэкапа
    • Viktor2004
      Товарищи, подскажите пожалуйста что можно поднастроить При снятии фаски получается рябь. SERVO ERROR в пределах 5 микрон Series31i Model B   VID_20240420_145644.mp4 CNCIDNUM.TXT CNC-PARA.TXT
×
×
  • Создать...