Lịch sử của bộ xử lý đồ họa hiện đại, Phần 5

Trong phần thứ tư của lịch sử bộ xử lý đồ họa hiện đại, chúng ta đã đạt đến điểm mà thị trường bao gồm ba đối thủ cạnh tranh: AMD, Intel và Nvidia. Đến năm 2013, tất cả đều đi theo một con đường tương tự cho thiết kế kiến trúc của họ và tất cả đều nhắm mục tiêu vào PC và máy trạm. Điều này được quyết định bởi hướng kết xuất đang được thực hiện, các yêu cầu do API đồ họa đặt ra và ứng dụng rộng rãi hơn của GPU vào điện toán và AI.

Tuy nhiên, trong những năm tiếp theo, bộ xử lý đồ họa sẽ trở thành một trong những thành phần lớn nhất, phức tạp nhất và đắt nhất có thể tìm thấy trong hầu hết mọi thiết bị điện toán.

…trong những năm tiếp theo, bộ xử lý đồ họa sẽ trở thành một trong những thành phần lớn nhất, phức tạp nhất và đắt nhất có thể tìm thấy trong hầu hết mọi thiết bị điện toán.

Vào năm 2014, chúng ta đã chứng kiến hầu hết các nhà cung cấp lớn phát hành các kiến trúc mới cũng như một loạt sản phẩm sử dụng các công nghệ cũ hơn. Trong trường hợp của AMD, dòng sản phẩm của họ bao gồm hầu hết các hệ thống trước đó. Trong thị trường máy tính để bàn, chúng tôi được cung cấp các mẫu sử dụng Graphics Core Next (GCN) 1.0 và thậm chí là kiến trúc TeraScale 2 cũ hơn. Một ví dụ điển hình trước đây là Radeon R9 280, được phát hành vào tháng Ba.

Đây là Radeon HD 7950 đã được đổi thương hiệu từ hai năm trước, nhưng ít nhất AMD cũng có lý khi tung ra mức giá thấp hơn so với phiên bản đầu tiên. Không lâu sau sản phẩm đó, Radeon R9 295X hỗ trợ GCN 2.0 xuất hiện và nó hoàn toàn trái ngược với 280.

svg+xml,%3Csvg%20xmlns= Lịch sử của bộ xử lý đồ họa hiện đại, Phần 5

Được trang bị hai GPU, hệ thống làm mát bằng nước tùy chỉnh và mức giá 1.499 đô la, nó đã nhảy thẳng lên đầu bảng hiệu suất và chúng tôi rất ngạc nhiên về mức độ tốt của nó (mặc dù chi phí đáng kinh ngạc).

Vào tháng 9 năm 2014, AMD đã phát hành Radeon R9 285 – thẻ này sử dụng chip mới, với sự làm mới kiến trúc GCN của họ, mang lại những cải tiến nhỏ trong bộ đệm và hệ thống tessname. Với mức giá 250 đô la, nó được dùng để thay thế R9 280 cũ và đi kèm với xung nhịp cao hơn. Tuy nhiên, nó chỉ nhanh hơn một chút do băng thông bộ nhớ ít hơn 25%.

svg+xml,%3Csvg%20xmlns= Lịch sử của bộ xử lý đồ họa hiện đại, Phần 5

Có vẻ kỳ lạ khi AMD đạt được ít tiến bộ như vậy với GCN 3.0 nhưng vào thời điểm đó, họ đang phải vật lộn với những khoản nợ lớn và mức thu nhập hoạt động thấp; để chống lại điều này, họ tập trung vào các thị trường có lợi hơn, chẳng hạn như hệ thống năng lượng thấp và thiết kế bán tùy chỉnh.

Ngược lại, vận may của Nvidia phần lớn phất lên trong năm đó. Họ đã đạt được mức tăng đều đặn về cả doanh thu và thu nhập ròng, bất chấp một số quyết định kỳ lạ về sản phẩm. Giống như AMD, họ đã sử dụng các hệ thống cũ hơn, các hệ thống được làm mới và một kiến trúc mới (Maxwell) – trong trường hợp của hệ thống sau, nó không được sử dụng trong mô hình hào quang, cao cấp nhất, mà thay vào đó xuất hiện ở mức trung bình 150 đô la. phạm vi cung cấp.

svg+xml,%3Csvg%20xmlns= Lịch sử của bộ xử lý đồ họa hiện đại, Phần 5

GeForce GTX 750 Ti được thiết kế để cạnh tranh với Radeon R7 265 của AMD. Mặc dù có công nghệ mới nhưng nhìn chung nó không nhanh bằng Radeon. Nếu đó là tất cả những gì Nvidia cung cấp vào tháng 2 năm 2014, người ta có thể nghĩ rằng họ đang mất đà.

Điều này càng phức tạp hơn bởi vì không phô trương gì cả, Nvidia đã làm mới dòng sản phẩm tốt nhất của họ – GeForce GTX Titan – với việc bổ sung đơn giản từ ‘Đen’ và tốc độ xung nhịp cao hơn một chút. Với giá 999 đô la, nó không đắt hơn người tiền nhiệm của nó, nhưng nó hầu như không xuất hiện trên các tiêu đề tin tức.

Để chống lại việc ra mắt Radeon R9 295X2 của AMD vào tháng 4, Nvidia đã tung ra Titan Z vào tháng sau. Là một bài tập về sự kiêu ngạo thuần túy, nó đã thu hút được một lượng lớn sự chú ý vì tất cả những lý do sai lầm.

svg+xml,%3Csvg%20xmlns= Lịch sử của bộ xử lý đồ họa hiện đại, Phần 5

Hầu như không có mẫu nào được cấp cho người đánh giá để phân tích và không mẫu nào sẵn sàng chi ra với mức giá yêu cầu 2.999 đô la. Đối với một số ít đã thử nghiệm nó, hiệu suất tổng thể kém lý tưởng đối với một sản phẩm đắt tiền như vậy – nói chung là kém hơn so với R9 295X2 và hai thẻ GeForce GTX 780 Ti cũ hơn của Nvidia trong SLI.

Các vấn đề đã được cải thiện đáng kể vào tháng 9, khi dòng GeForce GTX 900 có mặt tại các cửa hàng, mặc dù chỉ có hai mẫu.

GeForce GTX 980 và 970 sử dụng chip dựa trên Maxwell, mặc dù có một số điều chỉnh nhỏ và tiếp tục thu hút nhiều tiêu đề. Đầu tiên là về giá: lần lượt là 529 đô la và 329 đô la, các mẫu mới đều rẻ hơn GTX 780 và 770 khi ra mắt. Hiệu suất tốt, có thể cạnh tranh với các sản phẩm của AMD và danh mục sau của chính Nvidia.

svg+xml,%3Csvg%20xmlns= Lịch sử của bộ xử lý đồ họa hiện đại, Phần 5

Nhìn chung, lẽ ra đây phải là một năm cuối năm thành công đối với Nvidia, nhưng GTX 970 đang che giấu một ‘tính năng’ có thể nhanh chóng xóa bỏ mọi tin đồn tốt về sự ra mắt của loạt sản phẩm mới.

Bảng thông số kỹ thuật của mô hình cho biết rằng nó có bộ nhớ GDDR5 4 GB tốc độ 7 Gbps trên bus 256 bit – cho tất cả ý định và mục đích, giống như trên GTX 980. Chi tiết liên quan đến tuyên bố rằng GPU có 64 ROP ( kết xuất đơn vị đầu ra) và 2 MB bộ đệm L2.

Tuy nhiên, điều mà Nvidia giữ im lặng là điều này không hoàn toàn đúng – nó chỉ có 56 ROP và 1,75 MB bộ đệm L2, điều đó có nghĩa là bus bộ nhớ chỉ nên là 224-bit và do đó chỉ có 3,5 GB RAM. Vậy 0,5 GB còn lại ở đâu?

Nó thực sự ở đó, vì vậy nó là “4 GB trên bus 256 bit”, nhưng không giống như trong GTX 980. Do cấu hình của các cổng thanh ngang và bộ điều khiển bộ nhớ, hệ thống có thể đọc/ghi song song qua kết nối 224 bit đến 3,5 GB hoặc sử dụng một bus 32 bit duy nhất cho 0,5 GB còn lại.

svg+xml,%3Csvg%20xmlns= Lịch sử của bộ xử lý đồ họa hiện đại, Phần 5

Khi tin tức về sự lừa dối rõ ràng này được đưa ra ánh sáng, Nvidia đã cố gắng giải thích tình hình, đổ lỗi cho lỗi xuất bản tài liệu của họ cho báo chí.

Họ đã đưa ra lời giải thích cho quá trình thiết lập (như chi tiết trong hình trên) và xin lỗi về sai sót, đồng thời chỉ ra rằng cấu hình bộ nhớ ROP+ thực sự không phải là vấn đề và hoàn toàn có chủ ý. Nhưng thiệt hại đã xảy ra và hai năm sau, họ buộc phải bồi thường cho nhiều vụ kiện tập thể và đề nghị công khai 30 đô la cho tất cả những người mua GTX 970.

Intel cũng đã phát hành một kiến trúc mới trong năm 2014, có tên mã là Gen8 , như một phần cốt lõi của dòng CPU Broadwell của họ. GPU tích hợp hầu như không bao giờ thu hút được bất kỳ sự quan tâm nào, mặc dù là một phần đáng kể của CPU chết, nhưng thiết kế đã đánh dấu một số cải tiến đáng chú ý so với người tiền nhiệm của nó.

svg+xml,%3Csvg%20xmlns= Lịch sử của bộ xử lý đồ họa hiện đại, Phần 5

Cả hai cặp bộ xử lý SIMD ( một lệnh, nhiều dữ liệu ) trong EU ( Các đơn vị thực thi ) hiện có thể xử lý các phép toán số nguyên và dấu phẩy động, trong khi trước đây nó chỉ là một cặp. Việc tăng gấp đôi hiệu quả tốc độ thông lượng số nguyên đã phù hợp bằng cách cung cấp hỗ trợ cho các định dạng dữ liệu FP16 – một lần nữa, với tốc độ gấp đôi.

Những thay đổi này giúp GPU nhỏ tiếp xúc với khả năng kiến trúc của chip AMD và Nvidia – tuy nhiên, số lượng ít EU, đơn vị kết cấu và ROP vẫn khiến chúng không phù hợp để chơi game.

Đọc thêm:  Cách đo mức tiêu thụ năng lượng của PC

Không phải GPU nhỏ không có khả năng chạy các trò chơi có giao diện đẹp …

Trong thế giới điện thoại thông minh, Apple đã ra mắt iPhone 6 vào tháng 9, được cung cấp sức mạnh bởi A8 SoC ( system-on-a-chip ) được thiết kế nội bộ của họ. Bộ xử lý này đã sử dụng cấu trúc CPU và GPU được cấp phép từ Arm và PowerVR, nhưng bộ xử lý sau cũng chứa một số đơn vị tùy chỉnh do chính Apple tạo ra.

svg+xml,%3Csvg%20xmlns= Lịch sử của bộ xử lý đồ họa hiện đại, Phần 5

Apple đã ra mắt API kim loại mới của họ. Bộ sưu tập thư viện này bao gồm đồ họa và máy tính đổ bóng, tất cả đều được tối ưu hóa mạnh mẽ cho GPU trong iPhone và iPad. Khi các nhà phát triển trở nên quen thuộc hơn với phần mềm theo thời gian, nó mang lại cho các sản phẩm của Apple một lợi thế hiệu suất khác biệt so với đối thủ cạnh tranh.

Nhu cầu kiểm soát lập trình tốt hơn và các thư viện có độ trễ thấp không chỉ giới hạn ở điện thoại thông minh. Đằng sau hậu trường, Tập đoàn Khronos (một tập đoàn gồm các cơ quan trong ngành) đã bắt đầu làm việc để tạo ra phiên bản kế nhiệm cho OpenGL – mục đích là cung cấp API tính toán và đồ họa đa nền tảng, dựa trên công việc của AMD với phần mềm Mantle của họ.

Và phần mềm đã trở thành một tính năng quan trọng của năm tiếp theo.

Theo nhiều cách, năm 2015 chỉ là một sự lặp lại của năm trước. AMD tung ra gần 30 loại card đồ họa khác nhau, phần lớn sử dụng kiến trúc GCN 1.0 hoặc 2.0 cũ.

Tuy nhiên, cựu chiến binh chip silicon đã thực hiện một cách tiếp cận ngắn gọn để lên lịch phát hành sản phẩm. Vào tháng 6, chỉ một tuần sau sự xuất hiện của Radeon R9 390X hỗ trợ GCN 2.0 (về cơ bản là một GPU R9 295X2, có xung nhịp) và Radeon R9 Fury X hoàn toàn mới.

Mặc dù có sự chênh lệch 200 đô la giữa hai loại, nhưng Fury đắt hơn có thể biện minh cho mức giá đó. GPU 596 mm 2 , có tên mã là Fiji, được đóng gói trong một đơn vị đổ bóng 4096 đáng kinh ngạc – nhiều hơn 45% so với 390X. Đây cũng là card đồ họa cấp độ người tiêu dùng đầu tiên sử dụng HBM ( Bộ nhớ băng thông cao ).

svg+xml,%3Csvg%20xmlns= Lịch sử của bộ xử lý đồ họa hiện đại, Phần 5

Công nghệ này liên quan đến việc xếp chồng các chip DRAM lên nhau và chạy các kết nối thông qua chúng. Kết quả cuối cùng là một hệ thống nhỏ gọn hơn nhiều, cung cấp nhiều băng thông bộ nhớ, mặc dù tổng dung lượng không quá 4 GB cho lần lặp đầu tiên.

Nhưng tất cả những shader và RAM mới ưa thích đó đều phải trả giá – theo cả nghĩa đen và nghĩa bóng. Mức tiêu thụ điện năng cao nhất (mặc dù không nhiều hơn R9 390X) và thiết kế của AMD có vấn đề về nhiệt độ. Do đó, Fury X đã được bán với thiết lập làm mát bằng nước tích hợp, điều này hóa ra lại rất hiệu quả.

Phiên bản không phải X chỉ chạy đủ mát để không cần đến nó, do có xung nhịp thấp hơn và 8 Đơn vị tính toán bị vô hiệu hóa, đồng thời tất cả các biến thể bên thứ ba của kiểu máy này đều sử dụng kết hợp tản nhiệt và quạt truyền thống. Cũng như Radeon R9 Nano, phiên bản con của Fury X của AMD, được tung ra thị trường một tháng sau đó.

svg+xml,%3Csvg%20xmlns= Lịch sử của bộ xử lý đồ họa hiện đại, Phần 5

Dòng card đồ họa Fiji là sản phẩm hoạt động tốt nhất của AMD với tỷ suất lợi nhuận cao và mặc dù có mức giá cao, nhiệt độ và dung lượng bộ nhớ tương đối nhỏ nhưng nó vẫn bán rất chạy. Nó sẽ phải đối mặt với sự cạnh tranh gay gắt từ Nvidia, mặc dù họ thường có một nửa đầu năm tương đối thấp đối với các sản phẩm mới thú vị.

Một thứ khác mà AMD đưa ra vào đầu năm 2015 là FreeSync – một giải pháp thay thế miễn phí bản quyền cho G-Sync độc quyền của Nvidia (hãy đọc bài viết năm 2021 của chúng tôi). Cả hai đều là hệ thống tốc độ làm mới thay đổi cho phép màn hình duy trì đồng bộ hóa với các bản cập nhật khung hình, giảm sự cố rách màn hình mà không khóa tốc độ thay đổi tại chỗ.

GPU Radeon đã có khả năng làm điều này trong một thời gian, trong khi chip GeForce vào thời điểm đó yêu cầu một thiết bị bên ngoài được tích hợp vào màn hình.

Đối với Nvidia, phần lớn các bản phát hành của họ là các mẫu giá rẻ và tầm trung, trong đó đáng chú ý nhất là GeForce GTX 960, xuất hiện vào đầu năm. Chỉ với 199 đô la và sử dụng 120 W, đó là một minh chứng tốt hơn về tiến trình mà Nvidia đã đạt được với kiến trúc Maxwell.

svg+xml,%3Csvg%20xmlns= Lịch sử của bộ xử lý đồ họa hiện đại, Phần 5

Về mặt hiệu suất, nó ngang bằng với Radeon R9 280 và 280X, và rẻ hơn một chút. Điều này hoàn toàn là do sự khác biệt giữa các chip được sử dụng trong các sản phẩm cạnh tranh – GTX 960 có GPU 228 mm 2 , bao gồm 2,94 tỷ bóng bán dẫn, trong khi các mẫu cũ hơn của AMD sử dụng chip 432 mm 2 , với 4,31 tỷ bóng bán dẫn.

Mặc dù cả hai đều được sản xuất trên nút quy trình 28 nm của TSMC, nhưng kiến trúc mới hơn đã nêu bật mức độ tiến bộ đã đạt được kể từ lần đầu tiên GCN 1.0 xuất hiện.

Ở đầu kia của quy mô GPU, Nvidia chỉ cung cấp hai mẫu mới và cả hai đều sử dụng cùng một chip GM200. GeForce GTX Titan X ra mắt vào tháng 3 và GeForce GTX 980 Ti vào tháng 6. Với mức giá 999 đô la, chiếc trước đây được nhắm mục tiêu vào một thị trường rất ngách, nhưng 980 Ti đã được tung ra ở mức 649 đô la – vẫn rất đắt, nhưng phù hợp hơn nhiều với nhiều đối tượng hơn.

Radeon R9 Fury X vẫn chưa xuất hiện và các card đồ họa hàng đầu của Nvidia đang được so sánh với các sản phẩm như R9 295X2 và 290X. Tùy thuộc vào trò chơi, chúng mang lại hiệu suất tốt hơn, mặc dù các mẫu của AMD tiết kiệm chi phí hơn nhiều.

Năm 2015 cũng chứng kiến các bản phát hành phần mềm và thông báo sẽ tiếp tục định hình hướng mà GPU và các nhà cung cấp của chúng sẽ tuân theo cho các kiến trúc sắp tới của họ. Vào tháng 3, tại Hội nghị các nhà phát triển trò chơi hàng năm, Tập đoàn Khronos đã công khai tên dự án mà họ đang thực hiện: Vulkan trở thành một chủ đề nóng.

API đồ họa mới này đã mang lại những lợi ích đáng kể so với OpenGL và Direct3D, chủ yếu ở dạng chuyển nhiều quyền quản lý bộ nhớ, luồng và bản thân GPU cho nhà phát triển và tránh xa trình điều khiển GPU. Điều này sẽ giúp giảm đáng kể chi phí hoạt động của CPU mà các hệ thống tại chỗ vào thời điểm đó đang gặp khó khăn.

svg+xml,%3Csvg%20xmlns= Lịch sử của bộ xử lý đồ họa hiện đại, Phần 5

Bốn tháng sau, Microsoft ra mắt Windows 10 và cùng với nó là DirectX 12.

Phần đồ họa của API này được gọi là Direct3D cung cấp các tính năng tương tự như Vulkan, mặc dù nó chỉ bị giới hạn ở hệ điều hành mới – người dùng có các phiên bản Windows cũ hơn buộc phải ở lại với DirectX 11.

Tuy nhiên, không phải là nó có khởi đầu quảng cáo tốt nhất. Đương nhiên, trò chơi chỉ dành cho DirectX 12 đầu tiên là trò chơi của Microsoft – Gears of War: Ultimate Edition. Tiêu đề là một mớ hỗn độn thảm khốc, với vô số lỗi và hiệu suất khủng khiếp. Các trò chơi khác sử dụng API mới sẽ xuất hiện vào năm sau, nhưng phần mềm sẽ mất nhiều thời gian hơn để phát huy hết tiềm năng của nó.

Một trong những tính năng của nó, tính toán không đồng bộ, được các nhà phát triển đặc biệt quan tâm. Trình đổ bóng tính toán đã là một phần của DirectX trong một thời gian, lần đầu tiên xuất hiện trong DX11 vào năm 2008 (và thông qua các tiện ích mở rộng trong OpenGL và phần mềm CUDA của Nvidia). Được xử lý cụ thể bởi API DirectCompute, các trình đổ bóng này chạy trên một đường dẫn riêng biệt tới đường dẫn đồ họa (ví dụ: trình đổ bóng đỉnh, hình học, pixel) và tận dụng khả năng tính toán cho mục đích chung lớn hơn cho GPU.

svg+xml,%3Csvg%20xmlns= Lịch sử của bộ xử lý đồ họa hiện đại, Phần 5

Việc chuyển đổi giữa các đường ống dẫn thường dẫn đến một hình phạt về hiệu suất, do đó, khả năng thực thi cả hai cùng lúc bằng tính toán không đồng bộ có tiềm năng mạnh mẽ. Tuy nhiên, mặc dù cả AMD và Nvidia đều tuyên bố kiến trúc mới nhất của họ tuân thủ DirectX 12, nhưng chỉ có GPU của AMD tận dụng tốt nhất tính năng này – chip Maxwell của Nvidia không được thiết kế để hoạt động theo cách này một cách đặc biệt.

Đọc thêm:  Cập nhật BIOS của bạn: Tiện ích từ các nhà sản xuất bo mạch chủ hàng đầu

Trước khi hết năm, Google đã chuyển phần mềm TensorFlow của họ sang nguồn mở, cho phép công chúng truy cập đầy đủ vào thư viện trí tuệ nhân tạo và các công cụ máy học. Mặc dù đây không phải là sản phẩm đầu tiên thuộc loại này, nhưng những nỗ lực của Google trong năm đó đã được sánh ngang với Intel (với DAAL), Microsoft (CNTK) và Apache (MXNet).

Các card đồ họa đã được sử dụng cho các vai trò như vậy (AI, ML), nhưng nhu cầu ngày càng tăng về khả năng tính toán song song hàng loạt sẽ chi phối cách thức phát triển GPU.

Trong khi phần mềm của Intel chủ yếu dành cho CPU, thì phần mềm của Google và Apache sẵn sàng được sử dụng trên tất cả các loại phần cứng và cả AMD và Nvidia đều nhanh chóng tích hợp hỗ trợ cho chúng bằng bộ công cụ và trình điều khiển của riêng họ. Bản thân Google sẽ tiếp tục phát triển ‘GPU’ của riêng họ, được gọi là Bộ xử lý Tensor, để tăng tốc các mạng thần kinh cụ thể.

svg+xml,%3Csvg%20xmlns= Lịch sử của bộ xử lý đồ họa hiện đại, Phần 5

Card đồ họa đã được sử dụng cho những vai trò như vậy, nhưng nhu cầu ngày càng tăng về khả năng tính toán song song hàng loạt sẽ chi phối cách thức phát triển GPU. Bước đột phá nghiêm túc đầu tiên của Nvidia vào thế giới máy học là Jetson TX1 và Nvidia DRIVE.

Cả hai hệ thống đều sử dụng Tegra X1 SoC. Con chip nhỏ chứa các lõi CPU và GPU sử dụng kiến trúc Arm Cortex-A57 cho phần trước và thiết kế Maxell của riêng Nvidia cho phần sau. Mặc dù nó không phải là cường quốc, nhưng nó đã đánh dấu một điểm trong lịch sử của Nvidia rằng họ tập trung vào làm nhiều việc hơn là chỉ chơi game.

Mỗi người đam mê PC sẽ có một phần cứng yêu thích, có thể là vì lý do tình cảm hoặc tài chính, và rất nhiều trong số chúng sẽ có nguồn gốc từ năm 2016.

AMD vẫn tập trung vào việc giải quyết số dư ngân hàng của mình và phần lớn nhất trong ngân sách nghiên cứu và phát triển của họ được phân bổ cho CPU. Do đó, bộ phận đồ họa, Radeon Technologies Group, tập trung cải thiện tỷ suất lợi nhuận thông qua cải thiện năng suất sản xuất và chỉ cải tiến kiến trúc tương đối nhỏ.

GCN 4.0 xuất hiện cùng với việc phát hành dòng card Radeon RX 400 vào tháng 6 – các mẫu tầm trung và bình dân vẫn sử dụng chip GCN 1.0/2.0, nhưng RX 480 cao cấp nhất có thiết kế chip mới. GPU này đã được thu nhỏ lại đáng kể so với GPU của Fiji, chỉ với 36 Đơn vị tính toán (CU).

Mỗi người đam mê PC sẽ có một phần cứng yêu thích, có thể là vì lý do tình cảm hoặc tài chính, và rất nhiều trong số chúng sẽ có nguồn gốc từ năm 2016.

Có tên mã là Polaris 10 (hoặc Ellesmere ), cấu trúc đồ họa không thay đổi so với GCN 3.0, nhưng có nhiều công cụ hiển thị và video được cải tiến hơn. Nhưng đặc điểm chính của Polaris là kích thước của nó: chỉ 232 mm2, nó nhỏ hơn 60% so với Fiji. Một phần lý do đằng sau điều này đến từ việc sử dụng ít CU hơn.

Lý do chính là việc chuyển từ sử dụng TSMC sang GlobalFoundries cho nhiệm vụ sản xuất GPU. GloFo, như thường được gọi, được thành lập vào năm 2009 khi AMD bán bớt bộ phận chế tạo của mình và để sản xuất Polaris, họ đã cấp phép cho nút xử lý 14LPP của Samsung.

svg+xml,%3Csvg%20xmlns= Lịch sử của bộ xử lý đồ họa hiện đại, Phần 5

Hệ thống này đã sử dụng FinFET thay vì bóng bán dẫn phẳng, như được TSMC sử dụng trong nút 28HP của họ đã tạo ra các phiên bản tiền nhiệm của Polaris. Bản cập nhật cho phép đạt được tốc độ xung nhịp cao hơn, đồng thời giảm mức tiêu thụ điện năng và cung cấp mật độ thành phần cao hơn nhiều.

Radeon RX 480 không được thiết kế để trở thành thẻ hiệu suất cao nhất trên thị trường, chỉ là thẻ hiệu quả nhất về chi phí và ở mức 240 đô la, nó có vẻ phù hợp với tiêu chí đó trên giấy tờ. Trên thực tế, nó không tốt hơn Radeon R9 390 và GeForce GTX 970 cũ hơn, và mặc dù cả hai mẫu này đều ra mắt với giá cao hơn gần 100 đô la, nhưng vào thời điểm này, chúng có thể được mua với cùng một mức giá.

Tuy nhiên, đối với AMD, quy mô nhỏ có nghĩa là năng suất sản xuất sẽ tốt hơn nhiều so với năng suất đạt được ở Fiji – năng suất tốt hơn tương đương với biên lợi nhuận tốt hơn.

svg+xml,%3Csvg%20xmlns= Lịch sử của bộ xử lý đồ họa hiện đại, Phần 5

Nvidia vẫn ở lại với TSMC, sử dụng nút FinFET 16FF mới của họ để sản xuất kiến trúc mới của họ, Pascal. Sản phẩm này lần đầu tiên được tung ra thị trường vào tháng 5 năm 2016, dưới dạng GeForce GTX 1080.

Thiết kế của Nvidia cũng gặt hái được những lợi ích của công nghệ bóng bán dẫn mới và mặc dù không nhỏ như Polaris 10, nhưng chip GP104 cung cấp năng lượng cho 1080 lại nhỏ hơn 21% so với GPU trong GTX 980.

Bên trong GTX 1080 có thêm 38% bóng bán dẫn (tổng cộng 7,2 tỷ bóng bán dẫn), xung nhịp cao hơn 42% trong khi chỉ tiêu thụ nhiều điện năng hơn 10% so với phiên bản tiền nhiệm. Nó cũng trang bị một phiên bản RAM nhanh hơn, GDDR5X, cho băng thông bộ nhớ nhiều hơn 40% so với GDDR5 của 980.

MSRP có giá cao ngất ngưởng 9 đối với mô hình được gọi là ‘Phiên bản dành cho người sáng lập’, mặc dù các biến thể của bên thứ ba bắt đầu ở mức thấp hơn 0. Nhưng với tốc độ trung bình nhanh hơn khoảng 60% so với GTX 980 và nhanh hơn khoảng 30% so với sản phẩm tốt nhất của AMD (Radeon R9 Fury X), sự cải thiện hiệu suất đã đảm bảo nó bán rất chạy.

svg+xml,%3Csvg%20xmlns= Lịch sử của bộ xử lý đồ họa hiện đại, Phần 5

Trong sáu tháng tới, Nvidia sẽ tiếp tục phát hành ba GPU mới sử dụng kiến trúc Pascal: GP102, 104 và 106. Hai GPU sau sẽ cung cấp sức mạnh cho GTX 1070, 1060 và 1050 – tất cả đều được đón nhận và phổ biến mua hàng. Cái trước sẽ được sử dụng trong card đồ họa máy tính để bàn GPU đơn đắt nhất của Nvidia vào thời điểm đó.

Titan X được ra mắt với giá chào bán là 1.199 USD – đắt hơn 70% so với GTX 1080. Con số khổng lồ đó phù hợp với thông số kỹ thuật của GPU: 3584 đơn vị đổ bóng cho thông lượng FP32 lên tới 11 TFLOPS, RAM 12 GB GDDR5X, và băng thông bộ nhớ 384 GB/giây.

Nhưng với tất cả sức mạnh đó, nó không nhanh hơn 70% so với GTX 1080; nhiều thử nghiệm cho thấy nó trung bình tốt hơn khoảng 25%. Điều đó dường như không thành vấn đề, vì Titan X cũng bán chạy như những người anh em kém hơn của nó.

svg+xml,%3Csvg%20xmlns= Lịch sử của bộ xử lý đồ họa hiện đại, Phần 5

Thị trường card đồ họa năm 2016 cung cấp thứ gì đó phù hợp với hầu hết mọi ngân sách, từ 100 đô la đến 1.000 đô la. Hiệu suất và độ ổn định của GPU tốt hơn đáng kể so với trước đây và các nhà phát triển trò chơi bắt đầu tận dụng tối đa khả năng của chúng.

Nvidia đang tạo ra doanh thu tốt và trong khi thị phần của nó giảm do sự phổ biến của dòng sản phẩm RX 400 của AMD, thì tổng số lô hàng card đồ họa rời đang giảm dần do doanh số bán máy tính để bàn toàn cầu sụt giảm kéo dài.

Hiện tại, các nhà cung cấp GPU đã rơi vào một mô hình có thể dự đoán hợp lý: một kiến trúc mới sẽ được phát hành hai năm một lần hoặc lâu hơn, với việc làm mới dòng sản phẩm diễn ra ở giữa hoặc đôi khi cả hai cùng một lúc.

Đối với AMD vào năm 2017, đó là trường hợp của cái sau. Radeon RX 480 đã bị tăng xung nhịp nhỏ và được đổi tên thành RX 580 – có giá rẻ hơn GeForce GTX 1060 70 đô la, về tổng thể, nó hoạt động nhanh hơn một chút, mặc dù mức tiêu thụ điện năng cao hơn.

svg+xml,%3Csvg%20xmlns= Lịch sử của bộ xử lý đồ họa hiện đại, Phần 5

Radeon RX 560 tầm trung là một cải tiến đáng chú ý so với RX 460 mà nó dựa trên: hai Đơn vị tính toán bổ sung, nhiều RAM hơn và xung nhịp cao hơn với giá chỉ 99 đô la. GeForce GTX 1050 của Nvidia, hiện đã được một năm tuổi, tiết kiệm điện hơn một chút và hoạt động tốt hơn, mặc dù giá cao hơn một chút.

Đọc thêm:  Card đồ họa chơi game tốt nhất: 1920x1200 & 2560x1600

Điều đáng chú ý là GP107 cung cấp năng lượng cho 1050 được sản xuất bởi Samsung, sử dụng nút 14nm của họ – giống như nút được GloFo sử dụng để tạo GPU Polaris 21 trong RX 560. Cả hai đều có mức TDP (công suất thiết kế nhiệt) là 75W, mặc dù bộ xử lý Nvidia có nhiều bóng bán dẫn hơn và tốc độ xung nhịp cao hơn.

Khả năng kiểm soát điện năng tương đối yếu hơn của AMD lại được làm nổi bật với thẻ Radeon RX Vega, ra mắt vào giữa tháng 8. Kiến trúc Graphics Core Next đã được làm mới một lần nữa, lên phiên bản 5.0 và GPU về cơ bản đã được tái sinh ở Fiji. RX Vega 64 cao cấp nhất có chip bóng bán dẫn 12,5 tỷ, nhiều hơn 40% so với Fiji, nhưng do nút xử lý tốt hơn, nó có kích thước 495 mm 2 so với 596 mm 2 của Fiji.

svg+xml,%3Csvg%20xmlns= Lịch sử của bộ xử lý đồ họa hiện đại, Phần 5

Con chip nhỏ hơn cũng hỗ trợ nhiều RAM hơn nhờ sử dụng công nghệ HBM2 mới và hiệu suất tổng thể gần bằng GeForce GTX 1080. Mặc dù yêu cầu năng lượng cao (gần 300W đối với một số kiểu máy), phiên bản tiêu chuẩn có giá 499 USD – một ít hơn 100 đô la đầy đủ so với 1080.

Không phải Nvidia đặc biệt bận tâm. Dòng card đồ họa Pascal của họ bán rất chạy và vào tháng 3, họ đã củng cố vị thế của mình trong lĩnh vực dành cho người đam mê với GeForce GTX 1080 Ti. Cạc đồ họa mới này sử dụng cùng loại chip như trong Titan X, mặc dù có ít bộ đổ bóng hơn được kích hoạt.

Nhưng với đồng hồ cao hơn, nó hoạt động hầu như giống như mẫu halo nhưng được bán với giá thấp hơn 500 đô la, có vẻ như là một món hời đắt đỏ khi so sánh. Việc ra mắt cũng chứng kiến MSRP cho GTX 1080 giảm 100 đô la và doanh số của cả hai mẫu đã lập kỷ lục mới cho công ty Santa Clara.

svg+xml,%3Csvg%20xmlns= Lịch sử của bộ xử lý đồ họa hiện đại, Phần 5

Nvidia đã giới thiệu một kiến trúc mới vào năm 2017, nhưng không dành cho người tiêu dùng phổ thông. Volta nhắm đến thị trường máy tính chuyên nghiệp, nhưng thiết kế và bộ tính năng của nó sẽ ảnh hưởng mạnh mẽ đến hướng của các sản phẩm GeForce trong tương lai.

Đây là chip Nvidia đầu tiên có kiến trúc độc quyền cho một thị trường cụ thể. Tất cả các sản phẩm tập trung vào máy tính trước đây, chẳng hạn như Tesla K80, đều được lấy từ các cấu trúc có trong chip di động và máy tính để bàn tiêu dùng. Volta không hoàn toàn khác Pascal, nhưng với kích thước 815 mm 2 , với 21,1 tỷ bóng bán dẫn và 5120 đơn vị đổ bóng, nó là bộ xử lý lớn nhất mà họ từng sản xuất.

Ở đầu kia của quy mô, GPU được tích hợp vào CPU hoặc hệ thống trên chip (SoC) cũng đã đạt được những tiến bộ vững chắc. Mặc dù Intel không phá vỡ bất kỳ ranh giới công nghệ mới nào với CPU Coffee Lake của họ, nhưng kiến trúc đồ họa của họ đã đạt đến Gen 9.5 và tùy thuộc vào kiểu CPU, có tới 48 EU – mỗi EU hiện có 7 luồng rộng, với tối đa 4 hướng dẫn đồng thời. phát hành mỗi đồng hồ.

Đương nhiên, hiệu suất chơi game vẫn bị cản trở bởi quy mô tổng thể của GPU và khá kém so với các CPU dựa trên Zen mới của AMD với GPU Vega tích hợp. Nhưng nó cho thấy rằng Intel vẫn quyết tâm cải tiến kiến trúc.

svg+xml,%3Csvg%20xmlns= Lịch sử của bộ xử lý đồ họa hiện đại, Phần 5

Điều này trở nên đặc biệt rõ ràng khi họ thông báo rằng người đứng đầu Nhóm Radeon của AMD, Raja Koduri, đã gia nhập Intel với mục tiêu cụ thể là phát triển các sản phẩm đồ họa rời mới.

Lần cuối cùng Intel cung cấp đồ họa rời cho thị trường máy tính để bàn là gần hai thập kỷ trước, và mặc dù GPU tích hợp là một chuyện, nhưng việc mở rộng các thiết kế đó thành các sản phẩm cạnh tranh để chống lại các sản phẩm của AMD và Nvidia lại là một vấn đề hoàn toàn khác.

Thế giới điện thoại thông minh cũng chứng kiến sự tiến bộ nhất quán với bộ xử lý đồ họa của họ. Apple đã sử dụng thành công thiết kế của riêng họ và mặc dù các thành phần của hệ thống sử dụng công nghệ được cấp phép từ PowerVR, nhưng họ đã thông báo rằng họ sẽ chia tay nhau – một động thái đã gây ra thiệt hại không thể khắc phục được cho công ty không có thật.

svg+xml,%3Csvg%20xmlns= Lịch sử của bộ xử lý đồ họa hiện đại, Phần 5

Đối với người hâm mộ Android, Arm cung cấp những thứ như Mali-T860 và Qualcomm có GPU hoàn toàn đáng nể trong dòng SoC di động Snapdragon 600 của họ. Ngay cả con chip Tegra X1 hai năm tuổi của Nvidia cũng tìm thấy một ngôi nhà phổ biến trong Nintendo Switch.

Đây lẽ ra phải là một “năm vàng” nữa đối với GPU. Có rất nhiều mô hình cho mọi ngân sách và lĩnh vực, và AMD và Nvidia dường như rất hợp nhau ngoại trừ ở đầu thang hiệu suất đồ họa.

Tuy nhiên, một thứ đã âm ỉ trong nhiều năm, đột nhiên bùng nổ và các game thủ cũng như những người đam mê PC phải gánh chịu hậu quả của dư chấn. Việc sử dụng GPU để khai thác tiền điện tử đã tăng lên đáng kể do giá Bitcoin tăng chóng mặt.

svg+xml,%3Csvg%20xmlns= Lịch sử của bộ xử lý đồ họa hiện đại, Phần 5

Nguồn cung GPU mới cạn kiệt và giá thẻ cũ tăng đáng kể. Khai thác GPU đã trở thành một vấn đề bởi vì bộ xử lý đồ họa được phát hiện là cực kỳ giỏi trong việc thực hiện nhiều phép toán đơn giản hàng loạt . GPU của AMD đặc biệt tốt trong việc tính toán, mặc dù của Nvidia tiết kiệm điện năng hơn.

Bất chấp sự khác biệt, cả hai mẫu tầm trung và cao cấp đều có mức giá tăng nhất quán (cũng như tình trạng khan hàng liên tục), điều này sẽ diễn ra tốt đẹp trong năm sau. Và nếu người tiêu dùng đang hy vọng rằng các sản phẩm cho năm 2018 sẽ mang lại sự tỉnh táo cho ví của họ, thì họ sẽ hơi sốc.

AMD đã ra mắt thành công kiến trúc CPU Zen được thiết kế lại hoàn toàn của họ, sau đó họ đã thực hiện một cách tiếp cận thận trọng để dành nguồn lực hạn chế (cả tài chính và vật chất) để phát triển GPU của họ. Thay vì làm mới các tính năng bên trong của chip hoặc giới thiệu một bản cập nhật cho Vega, họ lại mắc kẹt với cơ sở quen thuộc: cải tiến.

Do đó, dòng Radeon RX 500 vẫn giữ nguyên như năm trước, mặc dù có thêm chữ ‘X’ trên tên kiểu máy – ví dụ: RX 580 trở thành RX 580X, v.v. Một số mô hình tầm trung và ngân sách đã được tăng dung lượng RAM mà chúng có, nhưng những thay đổi khác thì khan hiếm.

svg+xml,%3Csvg%20xmlns= Lịch sử của bộ xử lý đồ họa hiện đại, Phần 5

Sản phẩm mới duy nhất mà AMD đưa ra thị trường là Radeon RX 590. Nó sử dụng cùng chip GCN 4.0 Polaris như RX 580 và các thông số kỹ thuật cũng gần như giống nhau. Tuy nhiên, con chip này được sản xuất bởi GlobalFoundries Samsung, sử dụng các nút quy trình cải tiến (GloFo – 12LP, Samsung – 11 LPP).

Kết quả cuối cùng là TDP giảm 5%, xung nhịp cơ bản cao hơn 17% và xung nhịp tăng cường cao hơn 15% – và thêm 50 đô la cho MSRP. Những thay đổi nhỏ như vậy không làm cho RX 590 nổi bật theo bất kỳ cách nào và 580 (hiện ở dạng 580X) bán chạy hơn nhiều trong các cửa hàng.

Nvidia bắt đầu năm 2018 theo cách tương tự, đưa các phiên bản sửa đổi của dòng GTX 10 của họ ra thị trường, chẳng hạn như GeForce GT 1030 được trang bị DDR4 khốn khổ. các tháng trong năm, vì giá GPU quá cao.

svg+xml,%3Csvg%20xmlns= Lịch sử của bộ xử lý đồ họa hiện đại, Phần 5

Đến mùa hè, vấn đề đã được cải thiện và những người đam mê PC háo hức chờ đợi kiến trúc mới của Nvidia. Khoảng cách giữa các thiết kế GeForce mới đã tăng đều đặn trong thập kỷ – 15 tháng tách Maxwell khỏi Kepler và có 28 tháng giữa Pascal và Maxwell.

Những GPU Turing đầu tiên xuất hiện trên kệ vào tháng 8 và tháng 9. Đầu tiên là mẫu Quadro dành cho thị trường máy trạm chuyên nghiệp. Dòng sản phẩm GeForce không chỉ mang đến GPU và thẻ mới để mua mà còn cả công nghệ và điều kiện tiếp thị mới.

Nvidia đã sử dụng nhãn ‘GTX’ làm tiền tố hoặc hậu tố, kể từ năm 2005 nhưng hiện tại nhãn này đã được thay thế bằng RTX , với phần RT đại diện hiệu quả cho phương pháp dò tia . Từng là lĩnh vực bảo tồn của ngành công nghiệp điện ảnh, khả năng mô hình hóa ánh sáng thời gian thực chính xác hơn đã có sẵn trong một card đồ họa máy tính để bàn tiêu chuẩn.

Đọc thêm:  Alienware 13 + Đánh giá bộ khuếch đại đồ họa

Trước đó, Microsoft đã công bố một API mới, được gọi là DirectX Raytracing (DXR) tại sự kiện GDC năm đó. Họ trình bày chi tiết cách thức hoạt động của hệ thống và giới thiệu một số video từ EA, Epic và Futuremark. Mặc dù Nvidia và biệt danh RTX cũng có liên quan, nhưng đó là thông qua GPU Volta, không phải Turing.

Chúng tôi đã xem cách kiến trúc mới này xử lý tính năng dò tia với GeForce RTX 2080 và 2080 Ti, cả hai đều sử dụng cùng một chip TU102. Với 18,6 tỷ bóng bán dẫn và kích thước 754 mm 2 , GP102 dựa trên Pascal trông nhỏ bé khi so sánh. Mặc dù chỉ có hơn 4600 lõi đổ bóng, nhưng nó chỉ nhiều hơn 20% so với người tiền nhiệm của nó, vậy tại sao nó lại lớn hơn nhiều như vậy?

svg+xml,%3Csvg%20xmlns= Lịch sử của bộ xử lý đồ họa hiện đại, Phần 5

Rất nhiều thay đổi dưới mui xe chiếm sự gia tăng. Bộ nhớ đệm L1 và L2 có kích thước gấp đôi, băng thông bên trong được cải thiện đáng kể và việc bổ sung các lõi tensor và ray tracing cho mọi SM (bộ đa xử lý phát trực tuyến) trong GPU đều đóng vai trò của chúng.

Các lõi tensor – về cơ bản là một tập hợp các ALU FP16, vì vậy chúng cũng xử lý mã đổ bóng FP16 – đã xuất hiện trong Volta, nhưng đã được cập nhật một chút cho Turing; các lõi RT hoàn toàn mới, với mỗi lõi chứa hai đơn vị chuyên biệt: một để xử lý các thuật toán truyền tải BVH và một để kiểm tra các giao điểm nguyên thủy của tia.

Bỏ qua những lời lảm nhảm về công nghệ, mạch như vậy không thực sự cần thiết, vì tính năng dò tia có thể (và đã) được thực hiện trên CPU. Nhưng để làm điều đó trong thời gian thực, trong các trò chơi hàng ngày mà bất kỳ ai cũng có thể mua, thì phần cứng như vậy là hoàn toàn cần thiết.

svg+xml,%3Csvg%20xmlns= Lịch sử của bộ xử lý đồ họa hiện đại, Phần 5

Tuy nhiên, không có tựa game nào để thử nghiệm, cung cấp hỗ trợ DXR hoặc tương đương thông qua các tiện ích mở rộng OpenGL/Vulkan, khi chip Turing mới xuất hiện, những người đánh giá đã chuyển sang hiệu suất thô của nó trong các trò chơi ‘bình thường’. Kết quả, ít nhất là đối với phiên bản Ti, rất ấn tượng và càng củng cố thêm vị thế của Nvidia đối với vương miện cao cấp nhất.

Tuy nhiên, điều kém ấn tượng hơn nhiều là MSRP ra mắt – đối với GeForce RTX 2080 Ti, Nvidia đã đặt thẻ ở mức 999 đô la và 699 đô la cho 2080 (và thêm 100 đô la cho Phiên bản dành cho người sáng lập).

Trong trường hợp trước đây, đó là mức cao hơn 300 đô la so với GTX 1080 Ti, mặc dù RTX 2080 là mức tăng 100 đô la hợp lý hơn so với 1080. Nhưng với giá trị GPU chỉ trở lại bình thường sau sự cố khai thác tiền điện tử, 43 Nhiều người cho rằng việc tăng giá % cho Ti là không chính đáng.

Với dòng Turing vẫn do TSMC sản xuất, mặc dù trên phiên bản tùy chỉnh của nút quy trình 16FF của họ (được gắn nhãn 12FFN), những con chip khổng lồ sẽ không bao giờ tạo ra mức năng suất tương tự mà khuôn Pascal GP102 nhỏ hơn 38% có thể đạt được. AMD đã gặp phải vấn đề tương tự với những công ty như Fiji và Vega, mặc dù họ sẵn sàng chấp nhận chi phí sản xuất cao hơn.

svg+xml,%3Csvg%20xmlns= Lịch sử của bộ xử lý đồ họa hiện đại, Phần 5

Một yếu tố khác của thẻ GeForce RTX mới đã được Nvidia quảng cáo rất nhiều: DLSS hoặc Deep Learning Super Sampling . Ý tưởng chung đằng sau DLSS là hiển thị mọi thứ ở độ phân giải thấp hơn, sau đó sử dụng thuật toán do máy học xác định để nâng cấp khung hình cuối cùng lên độ phân giải của màn hình.

Các lõi tensor được quảng cáo là yếu tố chính đằng sau tính năng này, nhưng phiên bản đầu tiên của DLSS không sử dụng chúng trong card đồ họa của người tiêu dùng. Thay vào đó, tất cả điều này được thực hiện bởi lưới máy tính của chính Nvidia, được sử dụng để phân tích từng trò chơi, từng khung hình, để tìm ra quy trình nâng cấp sẽ là gì.

Ấn tượng ban đầu là tích cực, vì độ phân giải thấp hơn giúp cải thiện hiệu suất, trong khi khả năng nâng cấp đủ tốt để duy trì chất lượng hình ảnh tốt. Nhưng cũng giống như dò tia, không có trò chơi hoàn chỉnh nào sử dụng công nghệ này để ra mắt Turing.

Đối với những người đánh giá phần cứng, cuối năm 2018 và những tháng đầu năm 2019 đã cho họ cơ hội tốt hơn để kiểm tra bộ tính năng RTX của Nvidia. Vào thời điểm đó, đã có một số tựa game hỗ trợ DXR và DLSS.

Những trò chơi như Battlefield V, Shadow of the Tomb Raider và Metro Exodus đều sử dụng các hệ thống này, ở các mức độ khác nhau, nhưng có hai điều nhanh chóng trở nên rõ ràng: việc sử dụng phương pháp dò tia có khả năng cải thiện đáng kể tính chân thực của ánh sáng toàn cầu, bóng đổ, và phản xạ. Và thứ hai, chi phí hiệu suất đặc biệt cao và chỉ việc sử dụng DLSS mới giúp duy trì bất kỳ khả năng chơi nào. Và đây là ở 1080p – độ phân giải cao hơn mức này đơn giản không phải là một tùy chọn.

svg+xml,%3Csvg%20xmlns= Lịch sử của bộ xử lý đồ họa hiện đại, Phần 5

Mặc dù tốc độ khung hình từ 30 khung hình/giây trở xuống thường là tiêu chuẩn cho bảng điều khiển, nhưng khi chạy các trò chơi có đồ họa cực cao, điều đó trái ngược với những gì những người đam mê PC mong đợi khi bỏ ra 1.000 USD cho một card đồ họa.

Vào khoảng thời gian này, cả AMD và Nvidia đều phát hành card đồ họa mới – hãng đầu tiên cung cấp Radeon VII, trong khi hãng thứ hai cung cấp GeForce RTX 2060 và sự trở lại của biệt danh GTX, với 1660 Ti.

svg+xml,%3Csvg%20xmlns= Lịch sử của bộ xử lý đồ họa hiện đại, Phần 5

Radeon VII sẽ là thiên nga của GCN: phiên bản cuối cùng của kiến trúc lâu đời đó, hoặc có vẻ như vậy, trước khi AMD chuyển sang một thứ gì đó mới. Con chip cung cấp năng lượng cho thẻ là Vega 20, một phiên bản được tìm thấy trong Radeon Vega 64, mặc dù có một vài điều chỉnh và được sản xuất trên nút 7N mới của TSMC.

Trên lý thuyết, mô hình này có mọi thứ phù hợp với nó: 16 GB HBM2, băng thông 1024 GB/giây, cùng với 60 Đơn vị Điện toán chạy ở tốc độ lên tới 1.800 MHz.

Với mức giá yêu cầu là 700 đô la, AMD đã so sánh nó với GeForce RTX 2080 của Nvidia và tính trung bình, nó chỉ chậm hơn vài phần trăm trong quá trình thử nghiệm. Nhưng sản phẩm này không bao giờ dành cho các game thủ, vì nó chỉ là một Radeon Instinct được cải tiến lại, một mô hình điện toán cấp máy trạm.

Mặt khác, GeForce GTX 1660 Ti do TU116 hỗ trợ hoàn toàn được nhắm mục tiêu để chơi game – đặc biệt là đối với những người có ngân sách rõ ràng. Với 279 đô la, bạn có thể nói lời tạm biệt với Tensor và RT Cores và chào đón một sản phẩm ngang tầm với Pascal GTX 1070 đắt hơn 100 đô la.

svg+xml,%3Csvg%20xmlns= Lịch sử của bộ xử lý đồ họa hiện đại, Phần 5

GeForce RTX 2060 được phát hành vào đầu năm 2019, giữ lại tất cả các tính năng của RTX, nó đắt hơn gần 30% so với GTX 1660 Ti, nhưng chỉ nhanh hơn trung bình 12%, vì vậy nó không mang lại giá trị đồng tiền như nhau.

Mặc dù vậy, cả hai mẫu chính đều cung cấp một số cứu trợ đối với việc Nvidia định giá các mẫu RTX dành cho người đam mê của họ – trong trường hợp của 2080 Ti, nó đã tăng hơn 300 đô la. Sau đó, họ sẽ được tham gia bởi những thứ như GTX 1650, được phát hành với giá 149 đô la.

AMD đã giấu kiến trúc mới của họ cho đến mùa hè, khi họ phát hành dòng Radeon RX 5000, được cung cấp bởi chip Navi 10. Kiến trúc GCN đã được đại tu toàn diện, chuyển đổi thành RDNA và cùng với đó là giải quyết nhiều hạn chế mà thiết kế cũ mắc phải.

svg+xml,%3Csvg%20xmlns= Lịch sử của bộ xử lý đồ họa hiện đại, Phần 5

Trong khi Nvidia nhắm đến việc làm hài lòng tất cả các thị trường với Turing, thông thường cũng như chuyên nghiệp, thì RNDA hoàn toàn là về trò chơi. Các thông số kỹ thuật cơ bản chỉ ra rằng nó kém hơn Radeon Vega 64, với ít Đơn vị tính toán hơn đáng kể. Nhưng AMD đã làm lại kiến trúc để cải thiện việc phát hành lệnh và luồng dữ liệu nội bộ, và kết quả cuối cùng là một card đồ họa không kém xa Radeon VII và GeForce RTX 2070. Ra mắt với giá 399 USD, nó đã hạ gục cả hai mẫu và với chip có kích thước mảnh mai 251 mm 2 (do nút 7N của TSMC), nó cũng mang lại cho AMD năng suất tốt.

Đọc thêm:  10 game PC được mong đợi nhất năm 2017

Trong khi một số người thất vọng vì GPU mới không phải là mẫu cao cấp nhất và những lời chỉ trích về tính ổn định cũng như trình điều khiển cuối cùng sẽ trở thành tin tức đáng chú ý, Navi đã chứng minh rằng có thể có hiệu suất chơi game tốt mà không cần đến chip và thẻ giá khổng lồ.

Nvidia đã sẵn sàng đáp trả dòng Radeon RX 5000 dưới dạng các mẫu ‘Super’ – trong suốt năm 2019, RTX 2080, 2070, 2060, GTX 1660 và 1650 đều sẽ được làm mới với GPU có nhiều lõi đổ bóng hơn và xung nhịp cao hơn. Hiệu suất bổ sung được hoan nghênh vì thực tế là MSRP không thay đổi, ngoại trừ những năm 2060.

Dự án GPU rời của Intel bắt đầu hình thành. Lúc này nó đã có một cái tên rõ ràng, X e và một số chi tiết về các mẫu tiềm năng đang được khám phá. Mặc dù vậy, chuyến đi chơi đầu tiên của nó vẫn sẽ diễn ra trên thị trường đồ họa tích hợp.

Năm 2020 sẽ trở thành một năm của những vận may khác nhau. Trong bối cảnh đại dịch toàn cầu, AMD, Intel và Nvidia đều đã phát hành các card đồ họa mới có kiến trúc và thiết kế sản phẩm mới.

Microsoft và Sony cũng đưa các bảng điều khiển mới ra thị trường, trang bị nhiều công nghệ và tính năng mới, với việc hợp nhất các bản cập nhật API trong vài năm trước đây với việc phát hành DirectX Ultimate.

svg+xml,%3Csvg%20xmlns= Lịch sử của bộ xử lý đồ họa hiện đại, Phần 5

Thế giới máy tính và AI chuyên nghiệp được cung cấp những thứ như AMD Radeon Instinct MI100 và Nvidia A100, cả hai đều có GPU khổng lồ (lần lượt là 750 và 856 mm 2 ) với sức mạnh khổng lồ (120 CU tạo ra 23 TFLOP FP32 hoặc 432 Lõi căng tạo ra 312 BF16 TFLOP).

Kiến trúc CDNA mới của AMD trước đây đã ra mắt, GCN tái sinh thành thị trường chỉ dành cho máy tính, trong khi Nvidia sử dụng thiết kế Ampere mới. Nó được bán trên thị trường như một sự thay thế trực tiếp cho Volta, giúp tăng hiệu suất lớn cho khối lượng công việc AI.

Nói về AI, Nvidia đã giới thiệu một phiên bản cải tiến của DLSS vào tháng 3, sử dụng một quy trình rất khác so với lần lặp đầu tiên. Giờ đây, các lõi tensor trong card đồ họa của người dùng sẽ xử lý thuật toán suy luận để nâng cấp hình ảnh và nhìn chung, hệ thống mới đã được đón nhận nồng nhiệt.

Những người đam mê máy tính để bàn sẽ phải đợi đến cuối năm để có một loạt GPU mới, nhưng sự kiên nhẫn của họ đã được đền đáp bằng loạt thẻ GeForce RTX 3000 và Radeon RX 6000. Các mô hình của Nvidia đã mang Ampere đến với đại chúng, mặc dù có sự khác biệt đáng kể giữa chip GA100 trong A100 và GA102 đã thúc đẩy dòng sản phẩm RTX. Cái sau về cơ bản là một bản cập nhật của Turing, có các cải tiến đối với lõi CUDA, Tensor và RT.

svg+xml,%3Csvg%20xmlns= Lịch sử của bộ xử lý đồ họa hiện đại, Phần 5

Trong trường hợp của các đơn vị đổ bóng chung, các ALU số nguyên giờ đây có thể xử lý các quy trình FP32 giống như các quy trình FP và Nvidia đã sử dụng điều này để thúc đẩy dòng 3000 có số lượng lõi gấp đôi so với các dòng trước đó. Mặc dù không hoàn toàn đúng, nhưng điều đó có nghĩa là GA102 có tiềm năng cung cấp thông lượng dấu phẩy động đáng kể.

Nhưng vì trò chơi không bị giới hạn hoàn toàn bởi bộ tạo bóng FP32 của chúng nên hiệu suất tổng thể của RTX 3090, 3080 và 3070 thấp hơn so với thông số kỹ thuật trên giấy đề xuất, mặc dù vẫn là một cải tiến đáng kể so với Turing. Tốt hơn nữa, giá ra mắt thường thấp hơn so với giá của dòng RTX 2000.

AMD đã sử dụng RDNA và điều chỉnh các khía cạnh quan trọng của nó, chẳng hạn như mức tiêu thụ điện năng, tần số hoạt động và thông lượng dữ liệu, để giảm thiểu các yếu tố cuối cùng đã hạn chế khả năng của thẻ RX 5000. RDNA 2 cho thấy rằng tiến trình nhất quán đạt được với kiến trúc Zen sẽ hướng tới mục tiêu của toàn công ty.

Thường được gọi là ‘Big Navi’, GPU Navi 21 chứa số lượng Đơn vị Điện toán gấp đôi so với người tiền nhiệm của nó, bộ nhớ đệm L3 128 MB đáng kể và bộ xử lý kết cấu phù hợp sẽ xử lý kiểm tra giao điểm tia-tam giác trong dò tia.

svg+xml,%3Csvg%20xmlns= Lịch sử của bộ xử lý đồ họa hiện đại, Phần 5

Dòng Radeon RX 6000 sẽ đưa AMD vào một sân chơi bình đẳng với Nvidia trong hầu hết các trò chơi, mặc dù các thẻ này tệ hơn đáng kể khi có tính năng dò tia và không cung cấp gì như DLSS để tăng hiệu suất.

Kiến trúc RDNA 2 tương tự, mặc dù có ít CU hơn và không có bộ đệm bổ sung, sẽ cung cấp năng lượng cho máy chơi trò chơi Xbox và PlayStation mới. Kết hợp với bộ xử lý Zen 2 trên cùng một khuôn, các hệ thống được cập nhật khiến các game thủ phải thèm thuồng trước tiềm năng mà các thiết bị mang lại.

Ngay cả Intel cuối cùng cũng đã phát hành một GPU rời mới, mặc dù chỉ dành cho OEM và các nhà xây dựng hệ thống. Trước đây được gọi là DG1, card màn hình Iris Xe không có gì đáng phấn khích, nhưng nó cho thấy Intel rất nghiêm túc trong việc cạnh tranh trên thị trường đồ họa.

Tất cả sự phấn khích và nhiệt tình về các bản phát hành mới cuối cùng sẽ chuyển thành sự thất vọng và tức giận, vì các vấn đề thông thường về nguồn cung và giá cả quá cao ngày càng tăng đến mức nực cười. Đối với Ampere dành cho máy tính để bàn, Nvidia đã chọn sử dụng Samsung cho các nhiệm vụ chế tạo và mặc dù chưa bao giờ được xác nhận trực tiếp, nhưng ấn tượng chung mà nhiều ngành cảm nhận là sản lượng của họ đơn giản là không tốt bằng TSMC.

svg+xml,%3Csvg%20xmlns= Lịch sử của bộ xử lý đồ họa hiện đại, Phần 5

Không phải là nó cuối cùng quan trọng. Khi năm 2020 sắp kết thúc và thập kỷ mới bắt đầu một cách nghiêm túc, nhu cầu về thiết bị điện tử và máy tính tăng vọt do hàng triệu người trên thế giới buộc phải làm việc tại nhà. Khi ảnh hưởng của Covid ngày càng nghiêm trọng, việc sản xuất các linh kiện cơ bản như ổn áp và vi điều khiển ngày càng bị hạn chế.

Nguồn cung cấp card đồ họa GeForce và Radeon trở nên đặc biệt thưa thớt, vấn đề không được hỗ trợ bởi một đợt bùng nổ khác trong khai thác tiền điện tử và việc sử dụng phổ biến bot để mua hàng loạt thẻ và bảng điều khiển từ các trang web. Hầu hết mọi mẫu GPU có sẵn đều tăng giá đáng kể và giá đồ cũ khớp hoặc vượt quá giá trị ra mắt ban đầu của chúng.

Và khi người tiêu dùng nói chung phải vật lộn với việc thiếu các lựa chọn, thì cả AMD và Nvidia đều có doanh thu tăng đáng kể, trong đó Nvidia có mức tăng trưởng gần 30% trong lĩnh vực trò chơi của họ. Những con số như vậy sẽ mang lại sự thoải mái rất ít cho những người đam mê chơi game trên PC, nhiều người trong số họ không thể hoặc không muốn trả mức giá quá cao mà card đồ họa hiện đang đòi hỏi.

Và vì vậy, khi chúng ta kết thúc phần thứ năm trong lịch sử của bộ xử lý đồ họa hiện đại, chúng ta sẽ cảm thấy thiếu sót nếu không nhìn về phía trước và xem liệu có thể xác định thập kỷ tới sẽ ra sao hay không. Tình hình hiện tại, liên quan đến nguồn cung và giá cả, sẽ không kéo dài mãi, nhưng cũng không có dấu hiệu cải thiện trước mắt.

Những gì chúng tôi biết là AMD trước đó đã nhắm mục tiêu năm 2022 là năm phát hành bản cập nhật cho kiến trúc máy tính và chơi game: RNDA 3 và CDNA 2. Cho dù điều này có đúng hay không, trong các trường hợp khác, thật khó để dự đoán nhưng không chắc là nó sẽ xảy ra. mất nhiều thời gian hơn mà.

svg+xml,%3Csvg%20xmlns= Lịch sử của bộ xử lý đồ họa hiện đại, Phần 5

Về cơ bản, RDNA 2 là phiên bản tinh chỉnh của phiên bản tiền nhiệm, với hiệu suất đạt được nhờ sự kết hợp của các thay đổi thiết kế để cải thiện tốc độ xung nhịp, hiệu suất đường ống và giảm chuyển động dữ liệu. Tính năng mới duy nhất là các đơn vị gia tốc tia, được tích hợp vào bộ xử lý kết cấu.

Đọc thêm:  Core i7 so với Ryzen 5 với Vega 64 & GTX 1080

Chúng tôi chắc chắn sẽ không thấy phiên bản chính mới của DirectX vào năm 2022, vì vậy RDNA 3 có thể sẽ có nhiều tối ưu hóa và tinh chỉnh tương tự. Hình ảnh trên nói rằng nó cũng sẽ được sản xuất trên một ‘Nút nâng cao’ nhưng điều này cho chúng ta biết rất ít. Họ sẽ sử dụng nút N7+ dựa trên EUV của TSMC hay nút khác, chẳng hạn như N6 hoặc N5?

GPU Navi 21 được sử dụng cho dòng Radeon RX 6800 là một trong những chip lớn nhất của AMD từng được thiết kế cho thị trường máy tính để bàn, với kích thước 520 mm2 (chỉ có Fiji là lớn hơn). Nhưng vì nó vẫn nhỏ hơn 30% so với TU102 của Nvidia, nên có khả năng một bộ xử lý thậm chí còn lớn hơn sẽ lên kệ.

svg+xml,%3Csvg%20xmlns= Lịch sử của bộ xử lý đồ họa hiện đại, Phần 5

Nvidia khá kín tiếng trong việc phát hành lộ trình công khai và người ta biết rất ít về những gì tiếp theo dành cho họ, ngoài những tin đồn về việc nó được gọi là Hopper (được đặt theo tên của Grace Hopper, người tiên phong trong khoa học máy tính). Giống như RDNA 2, Ampere là một sự tối ưu hóa của Turing và đã giải quyết được cấu trúc GPU thay đổi tương đối ít trong năm, rất có khả năng nó sẽ giống như vậy.

Và giống như thiết kế Navi của AMD, vòng tiếp theo của GPU Nvidia có thể trang bị nhiều đơn vị đổ bóng hơn, bộ đệm, v.v. – ngay cả khi họ giữ lại Samsung cho các nhiệm vụ sản xuất và thậm chí không thay đổi nút, chẳng hạn như GA102 có thể được làm lớn hơn 20% trước khi đạt kích thước tương đương với bộ xử lý Turing lớn nhất.

Nếu chúng ta bỏ qua các GPU như Volta, vốn không dành cho thị trường tiêu dùng, thì TU102 là GPU đơn lớn nhất được sản xuất và bán cho máy tính để bàn. Với kích thước 754 mm2, nó hạn chế rất nhiều số lượng khuôn có thể được lấy ra từ một tấm wafer 300 mm duy nhất – tốt nhất là khoảng 80 hoặc hơn. Vì vậy, chúng ta có thể thấy chip kích thước đó một lần nữa?

svg+xml,%3Csvg%20xmlns= Lịch sử của bộ xử lý đồ họa hiện đại, Phần 5

Lấy mẫu GPU lớn nhất của AMD và Nvidia trong những năm qua cho thấy xu hướng tuyến tính mơ hồ trong việc tăng kích thước khuôn, nhưng nó cũng làm nổi bật cách thay đổi nút xử lý có thể tạo ra sự khác biệt lớn như thế nào (ví dụ: so sánh kích thước Vega 10 và 20). Tuy nhiên, có quá nhiều biến thể trong dữ liệu để có thể sử dụng nó để ước tính một cách đáng tin cậy kích thước của bộ xử lý mà người ta có thể thấy trong mười năm tới.

Có lẽ một cách tiếp cận tốt hơn là xem xét sức mạnh xử lý mà các GPU trên cung cấp, với mật độ đơn vị nhất định (tức là hàng triệu bóng bán dẫn trên mỗi milimét vuông). Mặc dù thông lượng cao nhất của FP32, được đo bằng hàng tỷ thao tác dấu phẩy động mỗi giây, không phải là chỉ số duy nhất nên được sử dụng để đánh giá khả năng của GPU, nhưng đây là chỉ số có thể so sánh được. Điều này là do các thao tác đổ bóng nói chung tạo thành phần lớn tải xử lý và sẽ tiếp tục làm như vậy trong một thời gian.

Khi chúng ta nhìn vào biểu đồ của những số liệu đó (bên dưới), nó vẽ nên một bức tranh khá khác. Có những ngoại lệ ảnh hưởng phần nào đến các xu hướng, nhưng ngay cả khi chúng bị loại bỏ, mô hình tổng thể vẫn giống nhau.

svg+xml,%3Csvg%20xmlns= Lịch sử của bộ xử lý đồ họa hiện đại, Phần 5

Nó cho chúng ta thấy rằng Nvidia đã liên tục tập trung vào việc tăng sức mạnh xử lý thô với mỗi thiết kế mới – điều này có ý nghĩa khi xét đến cách sử dụng các con chip giống nhau trong các mẫu máy nói chung và chuyên nghiệp. Điều này cũng đúng với AMD cho đến khi họ phát hành RDNA, nơi sản phẩm chỉ nhằm mục đích chơi game.

GCN tồn tại ở dạng CDNA và cả trong GPU tích hợp trong APU Ryzen và mặc dù chỉ có một GPU sử dụng kiến trúc đó, nhưng nó thực sự sẽ có vị trí thấp hơn so với Navi 21 trên bảng xếp hạng. Điều này là do thiết kế đó được nhắm mục tiêu cho khối lượng công việc AI, trong đó xử lý FP32 tiêu chuẩn ít quan trọng hơn khối lượng công việc số nguyên và tensor.

Với việc cả Nvidia và AMD đều cung cấp khả năng tăng tốc dò tia, cũng như hỗ trợ các định dạng dữ liệu và phép toán cần thiết cho máy học trong GPU mới nhất của họ, các trò chơi trên PC và bảng điều khiển của thập kỷ này sẽ ngày càng sử dụng chúng nhiều hơn. Giống như khử răng cưa và tessname từng là quá khắt khe và chỉ có thể được sử dụng một cách tiết kiệm, điều này cũng đúng với những con heo hiệu suất ngày nay.

svg+xml,%3Csvg%20xmlns= Lịch sử của bộ xử lý đồ họa hiện đại, Phần 5

Điều này có nghĩa là GPU của năm 2030 sẽ thường xuyên đạt kích thước 800 mm2 và tạo ra hơn 1 TFLOP trên mỗi đơn vị mật độ? Liệu họ có ngày càng ủng hộ phương pháp dò tia và học máy hơn các khía cạnh truyền thống như trình đổ bóng cho mục đích chung hoặc xử lý kết cấu không? Có thể, nhưng có một khía cạnh quan trọng đối với tất cả những điều này có thể hạn chế các mô hình tăng trưởng như vậy hoặc những thay đổi trong thiết kế GPU cơ bản và tất cả đều xoay quanh chuyển động của dữ liệu.

Có hàng nghìn đơn vị đổ bóng, tensor hoặc lõi dò tia đều tốt và tốt, nhưng chúng sẽ bị bỏ mặc nếu chúng không thể tìm nạp hoặc ghi dữ liệu đủ nhanh. Đây là lý do tại sao kích thước bộ đệm và băng thông nội bộ đã tăng lên rất nhiều, kể từ khi bắt đầu ngành công nghiệp GPGPU.

svg+xml,%3Csvg%20xmlns= Lịch sử của bộ xử lý đồ họa hiện đại, Phần 5

Nvidia G80, con chip đầu tiên của công ty sử dụng bộ đổ bóng hợp nhất, chỉ có 16 kB bộ nhớ dùng chung cho mỗi SM (bộ đa xử lý phát trực tuyến), 16 kB bộ đệm kết cấu cho một cặp SM và tổng cộng 96 kB của Cấp 2. So sánh điều đó với GA102, trong đó mỗi SM nhận được 128 kB bộ đệm L1 và toàn bộ GPU chứa 6144 kB L2.

Khi các nút quy trình phát triển và các tính năng thành phần giảm kích thước, có vẻ như thậm chí còn có thể đóng gói nhiều thứ hơn. Tuy nhiên, SRAM (khối xây dựng chính của bộ đệm) giảm quy mô kém hơn nhiều so với các hệ thống logic và với rất nhiều đồ họa hiện đại. bộ xử lý là bộ đệm, kích thước chip có thể tăng kích thước mà không làm tăng số lượng bóng đổ hoặc khả năng dò tia theo cùng một tỷ lệ.

Hoặc nó cũng có thể là cách khác. Nvidia (và những hãng khác) đã thực hiện nghiên cứu quan trọng về việc mở rộng hiệu suất GPU bằng cách sử dụng thiết kế mô-đun – tức là có nhiều khuôn nhỏ hơn trên cùng một gói, giống như AMD làm với bộ ba trên CPU dựa trên Zen.

svg+xml,%3Csvg%20xmlns= Lịch sử của bộ xử lý đồ họa hiện đại, Phần 5

Mặc dù nghiên cứu như vậy chủ yếu dành cho thị trường chuyên nghiệp, nhưng điều đáng ghi nhớ là nhiều tính năng của Volta đã được đưa vào Turing, vì vậy có thể các game thủ vào cuối thập kỷ này sẽ có PC trang bị nhiều chip CPU và GPU, tất cả được tích hợp vào gói tương đối nhỏ gọn.

Nhưng bất kể chúng sử dụng định dạng nào, GPU của ngày mai sẽ tiếp tục vượt qua ranh giới của thiết kế chip VLSI và chế tạo bộ vi xử lý. Khả năng thô của GPU trong tương lai về thông lượng FP32 và băng thông nội bộ sẽ đạt đến mức mà chỉ 10 năm trước đây người ta chỉ có thể mơ tới.

Và với việc Intel và các hãng khác quyết tâm thâm nhập thị trường, tận dụng sự phát triển của GPGPU trong AI, chúng ta có thể chắc chắn một điều: AMD, Nvidia, v.v. vẫn còn nhiều năm nữa mới đạt đến giới hạn của những gì họ có thể đạt được với bộ xử lý đồ họa của họ.