In a recent interview, former NVIDIA researcher Richard Jarz shared his views on the importance of CUDA to the company's success in the field of artificial intelligence. He noted that thanks to this software ecosystem, NVIDIA was able to strengthen its position in the market, outperform competitors and achieve significant financial progress.
According to Jartz, the main difference between NVIDIA and other companies such as Intel and AMD is the presence of CUDA. This “wall” still remains insurmountable for competitors, despite their attempts to integrate their own solutions and make them more open to developers. An example of such efforts is AMD's ROCm platform and HIPIFY tools, which allow CUDA code to be converted to portable HIP C++, making it compatible with ROCm.
However, the use of code porting tools may significantly increase costs for customers choosing non-NVIDIA platforms. Achieving cutting-edge performance and access to essential features requires a one-time investment in the CUDA ecosystem, making NVIDIA the preferred choice for those working in AI, Jartz said.
Companies such as Tiny Corp recommend NVIDIA AI systems over AMD, emphasizing that the NVIDIA platform “just works,” providing the user with all the capabilities they need without additional effort or cost.
На китайских рынках появились новые варианты графических процессоров NVIDIA A100, которые отличаются от первоначальной спецификации увеличенным числом CUDA-ядер. Эти модели оснащены 7936 ядрами, что на 15% больше, чем у стандартных версий A100, предлагающих 6912 ядер
.
Эти уникальные GPU также имеют 96 ГБ памяти HBM2E с интерфейсом шины 6144 бит, расположенными в шести стеках по 16 ГБ каждый. Карты выполнены в форм-факторе PCIe и, по всей видимости, являются прототипами, изначально разработанными для систем GRID.
В списке характеристик упоминается, что базовая тактовая частота этих GPU составляет 1260 МГц, а информация о повышенной частоте не указана. Ожидается, что производительность карты составляет около 20 TFLOPs в одиночной точности и 10 TFLOPs в двойной точности, что сравнимо или превосходит производительность модели A100 PCIe с 80 ГБ памяти, которая показывает 19.5 TFLOPs и 9.74 TFLOPs соответственно.
Причины появления данных моделей на рынке до конца не ясны, однако предполагается, что NVIDIA могла изготовить эти GPU в 2020 году для конкретных клиентов, и теперь они появились в продаже. Некоторые из этих устройств также доступны на eBay по цене от 17 до 20 тысяч долларов.
AMD is making significant strides in supporting the Linux operating system by updating drivers for its upcoming RDNA 3+ and RDNA 4 GPUs. According to reports from Phoronix, the latest Linux kernel patches have added significant changes and improvements to ensure optimal support for the latest GPU immediately after they are launched.
Key changes to the AMDGPU and AMDKFD drivers include: HDCP, ODM, RAS handling improvements, Devcoredump improvements, code cleanup, as well as adding new VCN activity management features via sysfs, support for SMU 14.0.1 and SMUIO 14.0.2, updates for DCN 3.1.4 .3.5 and DCN XNUMX.x, fixes for SR-IOV, suspension and summary, and many other technical improvements.
Changes have also been made to request and error handling, improved synchronization of memory page releases with TLB flushing, code refactorings and fixes for handling GPU resets, and fixes for the second graphics pipeline on GC 10.x and 10.3.
These updates highlight AMD's determination to provide better Linux support over alternatives such as MESA's RADV driver, which is a more open and popular alternative in recent years due to its openness and widespread support in the community. AMD is committed to not only improving the technical support of its products, but also strengthening its position in the market, giving the user more and more reasons to choose their products for Linux-based systems.
Due to export restrictions in China, NVIDIA is facing difficulties in processing returns under warranty (RMA) requests for its flagship GeForce RTX 4090 GPU. According to the latest data from Chinese media outlet HKEPC, the company is offering direct refunds in cases where when shipping defective devices to Taiwan becomes impossible due to political restrictions.
This applies to graphics cards produced by both Taiwanese and local manufacturers. The decision to return the money came after the US imposed export bans aimed at limiting China's technological development. While in Hong Kong and China local repairs are carried out, simple problems such as fan replacement are dealt with locally, complex cases now result in a full refund.
NVIDIA has officially issued a statement that the cause of instability in games that many users are experiencing is the 13th and 14th generation processors from Intel. According to NVIDIA representatives, in recent months there have been many complaints about memory errors and shader compilation crashes associated with these processors.
The company encourages users experiencing similar issues to submit their complaints directly to Intel. For its part, Intel confirms the presence of problems and reports that work is underway to analyze them. Reducing the voltage is suggested as a temporary solution, but Intel does not recommend that users independently interfere with the processor's operating parameters to ensure stability. Such actions may result in a breach of warranty and other unintended consequences.
In light of the current situation, NVIDIA emphasizes the importance of resolving these issues as quickly as possible, as the stability of computer systems directly impacts the user experience of its products.
According to a recent leak from RedGamingTech, the new generation of AMD Ryzen 9000 processors is significantly superior to the previous series. It is noted that the Ryzen 9 9950X is 45% faster than its counterpart from the Ryzen 7000 line.
The source indicates that the 16-core Ryzen 9 9950X and 12-core Ryzen 9 9900X show significant performance gains thanks to increased frequencies and an updated Zen 5 architecture. Tests in Cinebench 2024 show that the Ryzen 9 9950X achieves approximately 170 points in single-threaded and 3000 points in multi-threaded modes, which is 40-45% higher than the Ryzen 9 7950X.
This breakthrough is due to both an increase in clock speed and improvements in architecture that allow more instructions to be processed per clock cycle. This confirms rumors of a significant increase in performance in the new generation. Previous performance gains between Ryzen generations have also been noticeable, but the Ryzen 9000 promises an even bigger jump, confirming AMD's trend of significantly improving its processors.
Insider information indicates that AMD plans to use the RDNA 3+ GPU architecture in its APUs until 2027. This solution will be implemented starting with the Strix Point APUs expected to be released this year. RDNA 3+, which is an optimized version of RDNA 3, was introduced at the AI PC Summit in China. The architecture promises improvements in the form of larger compute units and optimizations.
AMD's Strix Point APUs using RDNA 3+ can have up to 16 compute units in a mono design and up to 40 in a chiplet design. This greatly exceeds the capabilities of the current Phoenix and Hawk Point APUs. In the future, AMD may add even more compute units and increase clock speeds in new versions of Zen 5.
A comparison with the Vega architecture of previous generations of Ryzen APUs shows that this is not the first time AMD has stuck with a single graphics architecture across multiple generations. Thus, the Vega architecture was used from Ryzen 2000G to Ryzen 5000, spanning four generations and renamed SKUs in the Ryzen 7000 series.
New APUs from AMD such as Sound Wave have been spotted alongside Strix, Sarlak and Kraken, presumably with the latest Zen cores but with the same or updated RDNA 3+ graphics core. This speaks to AMD's strategy to maintain consistency and optimization in its graphics solutions in the coming years.
Intel анонсировала обновление названий своих серверных процессоров, переходя от маркировки Xeon Scalable к более простому «Xeon 6». Новая линейка будет включать в себя процессоры Sierra Forest с эффективными E-ядрами и Granite Rapids с производительными P-ядрами. Первые модели серии Xeon 6 обещают значительный прирост производительности и энергоэффективности.
Процессоры Intel Xeon 6 с P-ядрами (Granite Rapids) обеспечат улучшенную поддержку искусственного интеллекта, в том числе за счёт поддержки формата данных MXFP4, который снижает задержку следующего токена на 6,5 раз по сравнению с предыдущими поколениями. Также ожидается, что они смогут обрабатывать модели с 70 миллиардами параметров, например, Llama-2.
С другой стороны, процессоры с E-ядрами (Sierra Forest) выделяются четырёхкратным улучшением производительности на ватт и более чем двукратным увеличением плотности размещения в стойках по сравнению с предыдущими поколениями. Это позволяет значительно снизить энергопотребление и способствует достижению целей в области устойчивого развития.
Ожидается, что первые процессоры Sierra Forest поступят в продажу во втором квартале 2024 года, а за ними на рынок выйдут процессоры Granite Rapids.
В свете последних событий, Computex 2024 обещает стать значимым мероприятием для AMD, поскольку компания готовит к выпуску новое поколение процессоров Ryzen на архитектуре Zen 5. Среди ожидаемых новинок – широкий спектр моделей, включая Ryzen 9000X/X3D (Granite Rapids), Ryzen 9055HX (Fire Range) и Ryzen 9050H (Strix Point), а также продукты под кодовыми названиями Kraken Point и Sonoma Valley. Эти процессоры, предназначенные для настольных компьютеров, будут совместимы с материнскими платами AM5.
Интерес к платформе Zen 5 со стороны производителей материнских плат, в частности ASUS, подтверждается обновлениями BIOS с поддержкой AMD Zen 5 для платформ AM5. Новые драйверы управления платформой (PMF) также намекают на скорый выпуск семейства процессоров Ryzen "Zen 5" для настольных ПК.
В дополнение к этому, недавние обновления драйверов чипсета от ASUS, в которых были замечены указания на процессоры Ryzen 9000, подтверждают подготовку к запуску нового поколения. Хотя точная принадлежность этих процессоров к настольным или мобильным устройствам пока не уточняется, существует высокая вероятность, что они основаны на архитектуре Zen 5.
Текущий бум искусственного интеллекта влияет на разработку новых систем на чипе (SoC), где компании вроде AMD и Intel акцентируют внимание на нейронных процессорных блоках (NPU), отодвигая на второй план другие ключевые аспекты. Microsoft стремится к ускоренным возможностям ИИ, что привело к изменениям в SoC у AMD и Intel, где NPU стали приоритетом.
На форумах Anandtech обсуждаются изменения в APU Strix Point от AMD, где большой блок ИИ Engine был добавлен для улучшения производительности NPU, в результате чего сократился системный кэш, что могло бы повысить производительность CPU и iGPU. Intel также инвестирует в свои будущие чипы, например Arrow Lake, с упором на сегмент ИИ.
Эта тенденция может продолжаться до тех пор, пока не лопнет "пузырь ИИ", при этом AMD и Intel будут уделять больше ресурсов на ускорение NPU, оставляя потенциал других возможностей неиспользованным.