Single precision julia что это

Aida64

This benchmark measures the single precision (also known as 32-bit) floating-point performance through the computation of several frames of the popular “Julia” fractal. The code behind this benchmark method is written in Assembly, and it is extremely optimized for every popular AMD, Intel and VIA processor core variants by utilizing the appropriate x87, 3DNow!, 3DNow!+, SSE, AVX or FMA4 instruction set extension.

FPU Julia test consumes 4 MB system memory per calculation thread, and it is HyperThreading, multi-processor (SMP) and multi-core (CMP) aware.

Single precision julia что это

Забыли пароль? Введите ваш е-мейл адрес. Вы получите письмо на почту со ссылкой для восстановления пароля.

Авторизация
Быстрая регистрация

После регистрации вы можете задавать вопросы и отвечать на них, зарабатывая деньги. Ознакомьтесь с правилами, будем рады видеть вас в числе наших экспертов!

Создать аккаунт

Работа на Vamber
Интересные факты
10% от рефералов
ТОП авторов
Работа без опыта

Авторизация
Быстрая регистрация

CPU vs GPU догоняет потихоньку

Как сказано, на CPU использовался не OpenCL, а специально оптимизированные программы для вычислений, да и карточка уже далеко не топовая, но тем не менее. Видно, что в некоторых случаях CPU даже быстрее, а почти во многих не принципиально отстает.

Особенно интересно, что в таком очень важном для вычислений вопросе как скорость вычислений с плавающей запятой с двойной точностью (64 бита) процессор уже в два раза быстрее обычной карточки.

Топовые процессоры типа TR 3990x наверное и вообще быстрее будут. История развивается по спирали? С CPU начали массивно-параллельные задачи переносить на GPU, но по мере нарастания гонки ядер обычных CPU преимущества вычислений на видеокарте слабеют.

praseodim ★★★★★
01.03.20 04:01:18 MSK

В задачах, где игровой GPU хорош, CPU его ещё не догнали и никогда не догонят за счёт более узкой специализации первого. Начнём с того, что карта стоит 15 т.р. а процессор 42.5 т.р. и это цены по первой ссылке, которую я нашёл — реально б/у варианты карт после майнинга можно найти сильно дешевле.

Memory Read, Memory Write — судя по значениям это скорость PCI-express на твоей машине. Видимо карта одна, воткнута куда надо — в первый 16-лэйновый слот. Пиковая теоретическая скорость должна быть около 16 ГБ/c. У CPU времена read, write и copy плюс-минус одинаковые из-за того что оперативка подключена к CPU. На GPU видим что read/write — через PCI, а copy сильно быстрее — это уже работает контроллер памяти на GPU, он значительно быстрее по пропускной способности чем CPU-шный (в 4.25 раз уже давно не супер-карта обгоняет жирненький проц).

Single-Precision FLOPS в 4 раза больше чем на 24-ядерном процессоре. А вот с double видно что у процессора скорость только в два раза ниже, а у GPU — ровно в 16. Это нормально для игровых карт, так и заявлено в характеристиках. Есть профессиональные решения, в которых double на GPU только в два раза медленнее чем float. Но в играх такие вычисления не нужны, на игровых чипах их вырезают.

AES-256 — на CPU есть AES-NI, т.е. сравнивается по сути аппаратная реализация на CPU с софтварной на GPU. В Ryzen есть инструкции также и для ускорения семейства хешей SHA1, SHA256 — не знаю, используются ли они в тесте, может и да.

Итого, плюсы GPU — быстрая шина памяти внутри GPU, много ядер которые позволяют поддержать огромную производительность float, для double нужны профессиональные карты для вычислений.

CPU — много специальных команд для частых задач, обычная память но с хорошим кэшированием, double всего в два раза меньше по производительности чем float.

Особенно интересно, что в таком очень важном для вычислений вопросе как скорость вычислений с плавающей запятой с двойной точностью (64 бита) процессор уже в два раза быстрее обычной карточки.

Я вижу обратную тенденцию — когда-то игровые GPU просто не умели работать с double, а сейчас работают с 1/8 — 1/16 от производительности float.

Из любопытного — на GPU 24-битная целая арифметика работает с огромной скоростью, такой же как float — за счёт переиспользования вещественных ALU. А на CPU, который в основном и работает с целыми числами — 24-битные по скорости как 32-битные. А есть ли там вообще 24-битные инструкции, на CPU? Я таких не знаю. Если их нет — то очень логично что скорость как на 32-битных. Также эта скорость равна половинке от скорости даблов. Видимо из-за отсутствия инструкций типа multiply-add (mad), которые есть на GPU в том числе для 24-битных чисел.

Эффективность процессоров с разным GPU

team

Есть такая прога как AIDA64, многие наверняка в курсе. Показывает какое железо установлено в пк без драйверов. В ней есть бенчмарк для видео карт и процессоров — GPGPU Benchmark. Данный тест тестирует видео карту и процессор по ряду характеристик. Так вот там есть 2 интересных параметра которые имеют интересные показатели.

1. Single-Precision FLOPS — производительность с плавающей запятой для 32 бит приложений.

2. Single-Precision Julia — непосредственно тест на основе производительности в фпс.

Чем больше производительность по 1 характеристике, тем выше фпс по 2. Эти показатели(точнее 1) напрямую влияют на фпс в играх.

В чем суть наблюдения? В закономерности. Вот тут пример(скрин) теста на оригинальном сайте Аиды64. На этом скрине протестированы видео карта и процессор, неважно какие по сути.

Видео карта показала производительность(сухую так скажем) — 5518 Гфлопс, а процессор — 341 Гфлопс. При этом видео карта смогла отрисовать — 862 кадра в секунду(фпс), а процессор всего лишь — 142 фпс.

В чем интерес?)) В соотношениях. Производительность(сухая) видео карты — в 16 раз больше чем процессора. Но производительность в реальном(не сухом) тесте — в 6 раз больше.

К чему я веду? К тому на сколько неэффективно используется видео карта по сравнению с процессором. Сколько производительности просто вылетает в трубу.

В тестах производительность огромная и растет, а на деле растут лишь цифры. Эффективность видео карты ниже 50% от мощностей — Нонсенс.

Если Интел будет делать видео карты такими эффективными как процессоры, тогда у АМД и Нвидиа не будет ни шанса.

Куратор других игр и разного

25 Dec 2020 в 20:27 #2

Терафлопсы не самая лучшая метрика измерения производительности видеокарты, как я почитал

Do2K сказал(а):↑

Если Интел будет делать видео карты такими эффективными как процессоры, тогда у АМД и Нвидиа не будет ни шанса

Нажмите, чтобы раскрыть.

Интел самая плохоразвивающаяся и инновирующая компания из этой тройки

Single precision julia что это

Aida64

Single precision julia что это

CPU vs GPU догоняет потихоньку

Эффективность процессоров с разным GPU

Добавить комментарий Отменить ответ