Từ 20 lên 40: Câu chuyện nâng cấp card đồ họa

Tại một thời điểm nào đó, mọi người đam mê PC sẽ muốn thực hiện một bản nâng cấp nào đó. Nó có thể là toàn bộ nền tảng, với CPU mới, bo mạch chủ và một bộ RAM ưa thích. Hoặc nó có thể chỉ là một mục duy nhất, chẳng hạn như ổ cứng thể rắn mới.

Nhưng còn khi bạn đang tìm kiếm một card đồ họa mới và giá vẫn cao ngất ngưởng thì sao? Một trong những GPU mới nhất tốt hơn bao nhiêu so với một kiến trúc xuất hiện lần đầu cách đây hơn bốn năm? Chà, hãy đọc tiếp để tìm hiểu xem lựa chọn nâng cấp của một người đã diễn ra như thế nào.

Mọi người đều có cách sử dụng khác nhau đối với cạc đồ họa của họ – đối với một số người, nó sẽ hoàn toàn là để giải trí (chơi game, xem video), trong khi đối với những người khác, nó sẽ hoàn toàn dựa trên công việc (kết xuất, chỉnh sửa video, khối lượng công việc tính toán). Đối với tôi, đó là sự kết hợp của tất cả chúng, tập trung nhiều vào thử nghiệm các kỹ thuật dựng hình, đặc biệt là dò tia và AI.

Trong ba năm qua, tôi đã sử dụng MSI GeForce RTX 2080 Super Ventus XS OC cho tất cả các nhiệm vụ đó. Bỏ qua một bên cái tên ngu ngốc, nó là một con ngựa thồ thực sự, loại bỏ hầu hết mọi thứ được gửi theo cách của nó. Tuy nhiên, thẻ phải vật lộn với độ phân giải cao, nó khá vô vọng khi dò tia và thực sự bắt đầu cho thấy tuổi của nó.

svg+xml,%3Csvg%20xmlns= Từ 20 lên 40: Câu chuyện nâng cấp card đồ họa

Vì vậy, khi phải lựa chọn xem xét nâng cấp nào, có một từ chi phối quyết định: CUDA. Dù tốt hay xấu, nền tảng GPU và phần mềm của Nvidia gần như là tiêu chuẩn khi nói đến tính toán và kết xuất. Cả AMD và Intel đều đã đầu tư rất nhiều thời gian và tiền bạc vào việc phát triển các phần mềm như ROCm và OneAPI, nhưng không phần mềm nào tôi sử dụng cung cấp bất kỳ hỗ trợ nào cho chúng.

Điều đó có nghĩa là gắn bó với Nvidia và sau đó đưa ra lựa chọn khác – Ampere hay Ada? Mặc dù đã hơn hai năm tuổi, nhưng một thứ như GeForce RTX 3080 10GB vẫn rất có khả năng và có thể được tìm thấy mới ở Vương quốc Anh với giá khoảng 700 bảng Anh. Thị trường đồ cũ đặc biệt tràn ngập chúng và với một số mức giá tuyệt vời, nhưng đó không phải là con đường mà tôi muốn xem xét.

Tất nhiên, mẫu Ada duy nhất ở gần mức giá đó là GeForce RTX 4080 12GB 4070 Ti, với MSRP là £799 – ngoại trừ chúng không có giá đó. Các mô hình rẻ nhất có xu hướng vào khoảng £ 830, đây là mức chênh lệch 4% nhỏ nhưng khó chịu.

Trên lý thuyết, 3080 dường như là lựa chọn tốt hơn, không chỉ vì nó rẻ hơn 4070 Ti. Nó có một con chip lớn hơn về mặt vật lý, xét về số lượng cấu trúc – nó có nhiều Cụm xử lý kết cấu và đồ họa (GPC, TPC) nhất nên nó có thể xử lý nhiều hình tam giác cùng lúc hơn các loại khác. Nó cũng có nhiều đơn vị ánh xạ kết cấu (TMU) và đơn vị đầu ra kết xuất (ROP), thứ sau rất quan trọng ở độ phân giải cao.

Tại thời điểm này, cần đề cập đến một tiêu chí khác để quyết định và đó là độ phân giải màn hình của tôi: 4K. Điều này sẽ làm cho 4070 Ti trở thành đối thủ ở vị trí thứ hai so với 3080, nhưng cái trước có hai điểm tích cực chính: tốc độ xung nhịp và dung lượng bộ đệm L2.

Với xung nhịp tăng tham chiếu là 2,61 GHz, nó cao hơn gần 50% so với hai mẫu còn lại và điều đó bù đắp cho sự thiếu hụt tương đối của các thành phần. Ví dụ, thông lượng cao nhất của FP32 là 40,3 TFLOPS. 2080 Super đạt được với 11,2 và 3080 là 29,8 – đối với công việc AI và kết xuất ngoại tuyến, đây là một sự khác biệt lớn.

svg+xml,%3Csvg%20xmlns= Từ 20 lên 40: Câu chuyện nâng cấp card đồ họa

Và có bộ đệm L2. Kiến trúc RDNA 2 của AMD cho thấy tầm quan trọng của hệ thống bộ nhớ đệm đối với việc chơi game, với L4 Infinity Cache giúp giảm tải cho VRAM. Nvidia luôn sử dụng hệ thống phân cấp bộ đệm hai tầng đơn giản và các tầng riêng lẻ rất lớn có thể dẫn đến độ trễ tăng lên; Tuy nhiên, tốc độ xung nhịp cao hơn nhiều sẽ bù đắp cho điều này.

Ampere và Ada chia sẻ các cấu trúc Lõi Tensor rất giống nhau – có vẻ như 2080 Super chiếm thế thượng phong ở đây, nhưng các kiến trúc mới hơn có các lõi với số hoạt động trên mỗi đồng hồ gấp đôi so với thiết kế Turing cũ.

Đọc thêm:  Cập nhật đánh giá Wii U: 20 tháng sau

Vì vậy, với những gì tôi sẽ sử dụng thẻ, sự lựa chọn trở nên đơn giản. Bây giờ, điều duy nhất còn lại phải làm là chọn thương hiệu và kiểu máy của 4070 Ti, nhưng điều đó thật dễ dàng. Tôi vừa chọn cái rẻ nhất, hóa ra là Zotac RTX 4070 Ti Trinity OC. Thông thường, tôi sẽ không bận tâm đến bất kỳ mô hình ép xung nào của nhà cung cấp AIB nhưng mô hình này tình cờ rẻ hơn mọi thứ khác.

Tất nhiên, tôi đã biết 4070 Ti như thế nào so với 3080 vì Steve đã kiểm tra kỹ lưỡng nó. Với tốc độ khung hình trung bình hình học cao hơn 21% so với 3080, thẻ Ada mới hoạt động kém hơn so với các thông số kỹ thuật trên giấy (4070 cao hơn 35% trong tất cả các chỉ số kết xuất so với thẻ Ampere) nhưng điều đó thường xảy ra.

Vấn đề duy nhất là 2080 Super không được đưa vào các thử nghiệm đó. Tuy nhiên, nó đã được đưa vào các bài đánh giá của Steve dành cho thẻ RTX 3070, 3080 và 3090. Trong các thử nghiệm 4K, ba card đồ họa này có giá trị trung bình so với bảng Turing, như sau:

Từ bài đánh giá 4070 Ti, các số liệu trung bình hình học 4K của nó hoạt động như sau:

Vì vậy, kết hợp tất cả các số liệu này, tôi ước tính rằng 4070 Ti có thể nhanh hơn từ 90% đến 95% so với 2080 Super cũ của tôi. Tuy nhiên, đó có thể là từ chính xác vì các máy thử nghiệm khác nhau và các điểm chuẩn khác nhau đều được sử dụng.

Tất cả những thứ này sẽ hoạt động như thế nào trên Intel Core i7-9700K, bo mạch Asus Z390, máy tính 16GB DDR4-3000 của tôi lại là một vấn đề hoàn toàn khác. Một bước nhảy vọt đáng kể về hiệu suất như vậy có thể sẽ cho thấy những dấu hiệu rõ ràng về việc điểm chuẩn bị giới hạn bởi hệ thống. Tất cả sẽ đi xuống các bài kiểm tra cá nhân.

Không phải là tôi đã xoay sở để tiến xa với những thứ đó khi thẻ mới đến. Nó hoạt động hoàn toàn tốt trong khoảng 8 giờ trước khi một bộ điều khiển quạt và bộ điều khiển đèn LED quyết định thu dọn buổi biểu diễn và đi đến bãi biển. Những chiếc đèn đẹp đẽ mà tôi có thể sống mà không có nhưng bộ điều khiển quạt chết đã xử lý hai trong số ba chiếc quạt, vì vậy điều đó chắc chắn không thể chấp nhận được. Một RMA nhanh chóng (và nhanh chóng, ý tôi là 5 ngày…) sau đó và chúng tôi đã hoạt động trở lại.

Bộ thử nghiệm đầu tiên tôi chạy trên 4070 Ti mới là một bộ điểm chuẩn nhỏ của một người có tên là Nemez. Tôi biết được công việc của cô ấy thông qua nhóm tại Chips and Cheese và đó là một loạt thử nghiệm dựa trên Vulkan, được thiết kế để tạo ra các số liệu về thông lượng và độ trễ cho các hoạt động cơ bản của GPU.

Mặc dù tôi đã chạy qua tất cả các bài kiểm tra do bộ phần mềm này cung cấp, nhưng ba bài kiểm tra mà tôi quan tâm nhất là các phép tính nhân-cộng hợp nhất cũng như các điểm chuẩn về băng thông và độ trễ cho bộ đệm và hệ thống bộ nhớ. Cái đầu tiên (thường được viết tắt là FMA) là thịt và khoai tây của hầu hết các hoạt động của GPU; thử nghiệm thứ hai tìm ra bao nhiêu dữ liệu nhanh có thể được truyền đến/từ SM và thử nghiệm thứ hai là độ trễ bao nhiêu nano giây liên quan đến các lần truyền đó.

svg+xml,%3Csvg%20xmlns= Từ 20 lên 40: Câu chuyện nâng cấp card đồ họa

Trước tiên, hãy nhìn vào kết quả FMA, hãy nhớ rằng 4070 Ti có thông lượng FP32 cao nhất là 40,3 TFLOPS và cao nhất INT32 là 20,1 TOPS. Vậy tại sao thẻ của tôi tốt hơn thế này một chút? Vâng, đó là một kiểu máy được ép xung tại nhà máy, nhưng xung nhịp Boost của nó chỉ là 2,625 GHz – chỉ nhanh hơn 0,6%. Ở đây, chúng ta đang thấy tỷ lệ FP32 cao nhất là 41,4 TFLOP, tăng 2,7%.

Sự thật đơn giản là thẻ của Nvidia sẽ tăng tốc vượt quá xung nhịp tham chiếu của chúng, nếu chúng không đạt đến giới hạn năng lượng hoặc nhiệt. Trong quá trình thử nghiệm, 4070 Ti thực sự chạy ở tốc độ 2,835 GHz, tương đương với tốc độ FP32 cao nhất theo lý thuyết là 43,5 TFLOPS. 2080 Super cũng đang làm điều tương tự, do đó tại sao số liệu của nó cũng cao hơn mong đợi.

Sự khác biệt giữa card đồ họa mới và cũ dao động từ 80% (FP16) đến 244% (FP32). Mặc dù tôi không mong đợi để nhìn thấy con số thứ hai trong các trò chơi, nhưng sẽ có rất nhiều trường hợp mà tôi sẽ thấy mức độ cải thiện đó.

Đọc thêm:  Các bản mod trò chơi PC hay nhất mà bạn có thể chơi ngay hôm nay

svg+xml,%3Csvg%20xmlns= Từ 20 lên 40: Câu chuyện nâng cấp card đồ họa

Thử nghiệm băng thông sử dụng trình đổ bóng điện toán Vulkan để tính toán tốc độ truyền dữ liệu trên nhiều kích thước thử nghiệm, sử dụng tất cả các SM trong GPU. Các chip Turing có bộ đệm L1 96 kB được phân vùng bởi trình điều khiển. Ở chế độ đồ họa, 64 kB sẽ được đặt làm bộ nhớ dùng chung cho trình đổ bóng, 32 kB còn lại làm bộ đệm dữ liệu L1/bộ đệm kết cấu/tràn tệp đăng ký.

Tuy nhiên, trong chế độ điện toán, bộ nhớ đệm đó có thể được đặt là 32 kB chia sẻ/64 kB dữ liệu hoặc ngược lại. Với việc 2080 Super đạt băng thông L1 dự kiến, mức giảm ở giai đoạn 32 kB cho thấy các trình điều khiển đang hiểu trình tạo bóng Vulkan là “đồ họa”, do đó chỉ có 32 kB bộ nhớ đệm dữ liệu.

svg+xml,%3Csvg%20xmlns= Từ 20 lên 40: Câu chuyện nâng cấp card đồ họa

Trong Ada Lovelace, có tổng cộng 128 kB bộ đệm L1 nhưng việc phân vùng bộ đệm phức tạp hơn. Các trình điều khiển hiện đang đánh giá bài kiểm tra ở ‘chế độ tính toán’ vì băng thông giảm xuống ở mức 112 kB, cho thấy rằng 16 kB đang được sử dụng làm bộ nhớ dùng chung và phần còn lại làm bộ đệm dữ liệu.

Tôi tự hỏi có bao nhiêu ứng dụng khác không được trình điều khiển ‘đọc’ chính xác. Nhưng không có vấn đề gì, vì phần còn lại của bài kiểm tra hoạt động chính xác như mong đợi – bộ đệm L2 48 MB của 4070 Ti, tốc độ xung nhịp cao hơn và số lượng SM lớn hơn được hiển thị rõ ràng. Và trong cả hai thẻ, khi kích thước thử nghiệm vượt quá giới hạn bộ đệm, băng thông gần như giống hệt nhau vì dữ liệu đang được lấy từ VRAM.

Ít nhất với tôi, một điều đặc biệt thú vị là sự khác biệt về băng thông bộ đệm L1 đo được so với giá trị lý thuyết. 2080 Super gần như đạt 100%, trong khi 4070 Ti là khoảng 92%. Có lẽ đó chỉ là một sự kỳ lạ của chính bài kiểm tra.

svg+xml,%3Csvg%20xmlns= Từ 20 lên 40: Câu chuyện nâng cấp card đồ họa

Kết quả về độ trễ đã xác nhận những gì tôi đã nghi ngờ – Nvidia không làm gì để giảm số chu kỳ đọc/ghi bộ đệm L1 trong Ada, vì độ trễ thấp hơn của 4070 Ti (thấp hơn 24%) hoàn toàn là do tốc độ xung nhịp cao hơn ( mỗi chu kỳ Ada nhanh hơn 30% so với chu kỳ Turing). Tuy nhiên, điều ấn tượng là mặc dù đã tăng kích thước bộ đệm L2 lên gấp 12 lần, nhưng độ trễ tổng thể vẫn thấp hơn so với Turing.

Vì vậy, tốc độ tính toán và băng thông đều tăng lên và độ trễ tổng thể cũng tốt hơn, điều này lý tưởng cho mục đích sử dụng cạc đồ họa mới. Tất nhiên, không có gì ngạc nhiên, nhưng thật tốt là nó đang diễn ra như mong đợi.

Kiểm tra GPU là một công việc mệt mỏi. Rất nhiều lần lặp lại: định cấu hình điểm chuẩn và trò chơi, chuyển đổi giữa các phần cứng và phần mềm khác nhau, chạy nhiều lần để đảm bảo độ tin cậy, kiểm tra lại các kết quả có vẻ kỳ quặc, lặp đi lặp lại và lặp đi lặp lại. Vì tôi không muốn dành nhiều thời gian cho khía cạnh này (tức là tôi chỉ muốn tiếp tục và sử dụng thứ đó), nên tôi đã chạy một số điểm chuẩn tiêu chuẩn mà bất kỳ ai cũng có thể thử.

Để bắt đầu, tôi đã sử dụng các điểm chuẩn của Blender, V-Ray và 3DMark. Tất cả đều đẹp và đơn giản để sử dụng, không cần lo lắng về cài đặt hoặc những thứ tương tự.

Không có gì được hiển thị trên màn hình trong các thử nghiệm này, có thể nói đó là tất cả các tính toán hậu trường. Nhưng bài kiểm tra Monster cho thấy rõ hiệu suất FP32 mà 4070 Ti có được so với 2080 Super là bao nhiêu. Các thử nghiệm khác rõ ràng là ít tập trung hơn vào khía cạnh đó của GPU, nhưng sự cải thiện vẫn được hoan nghênh – chúng tôi thực hiện rất nhiều công việc Blender trong gia đình mình, vì vậy nó đã được đón nhận rất tích cực.

svg+xml,%3Csvg%20xmlns= Từ 20 lên 40: Câu chuyện nâng cấp card đồ họa

Điểm chuẩn GPU V-Ray được thiết kế để chỉ chạy trên thẻ Nvidia, vì cả hai bài kiểm tra đều sử dụng CUDA. Thử nghiệm đầu tiên là kết xuất ngoại tuyến cổ điển, tương tự như Blender, nhưng thử nghiệm thứ hai truy cập các lõi dò tia trong GPU.

Thật đáng tiếc khi phần mềm của Chaos bị khóa phần cứng nhưng nó không phải là gói mà tôi sử dụng thường xuyên (nếu có, ngày nay), vì có sẵn các kết xuất tốt và hoàn toàn là nguồn mở. Ít nhất dữ liệu cung cấp thêm xác nhận về việc nâng cao hiệu suất điện toán.

Đọc thêm:  Intel Haswell ra mắt: Đánh giá Core i7-4770K

Vì vậy, với sự gia tăng khả năng tính toán thô đã được chứng minh một cách dễ dàng (thật không may, tôi không có thời gian để khám phá bất kỳ gói phân tích dữ liệu hoặc AI nào), đã đến lúc kiểm tra phần ‘đồ họa’ của cạc đồ họa mới.

3DMark của UL sử dụng Direct3D để thực hiện tất cả quá trình kết xuất, nhưng trong trường hợp của ba thử nghiệm đầu tiên, đường dẫn DirectX Ray Tracing (DXR) cũng được sử dụng; đối với Kiểm tra tính năng, hầu hết tất cả đồ họa đều được tạo ra theo cách này. Các điểm chuẩn cũng được thiết kế để tải lên CPU ít nhất có thể, do đó, các kết quả trên thể hiện tình huống tốt nhất cho cạc đồ họa mới. Điều ngạc nhiên lớn nhất là sự cải tiến của DXR nhưng chỉ vì người ta phải tin lời Nvidia khi nói đến hiệu suất của các đơn vị dò tia của nó.

Đối với 2080 Super, ‘RT TFLOPS’ (bất kể điều gì được cho là) là 33,7 được yêu cầu, trong khi đó là 92,7 đối với 4070 Ti – tăng 260%. Thử nghiệm 3DMark không hoàn toàn phù hợp với con số đó nhưng đó là một cải tiến đủ để xác minh rằng số lượng đơn vị RT tăng lên, thông lượng đổ bóng cao hơn và bộ nhớ đệm L2 lớn hơn và nhanh hơn đều góp phần quan trọng vào việc nâng cao hiệu suất dò tia.

Hiện tại, tôi ít quan tâm đến việc sử dụng nó nhiều trong trò chơi (chỉ có một số tựa game mà nó thực sự tỏa sáng) và quan tâm nhiều hơn đến việc khám phá các mô hình chiếu sáng trong các công cụ phát triển và đoạn mã. Tất nhiên, tôi không nhận được nhiều tính năng RT hơn, chỉ là hiệu suất cao hơn.

Một lợi thế của việc sử dụng 3DMark là có thể lặp đi lặp lại các điểm chuẩn, cho phép tôi sử dụng GPU-Z để ghi lại số liệu mức tiêu thụ năng lượng trung bình của bo mạch trong các thử nghiệm đó. Mặc dù có thể có một số nghi ngờ về độ chính xác của các số liệu theo thời gian thực, nhưng việc sử dụng máy ghi điện ổ cắm trên tường có nghĩa là tôi có thể xác nhận các số liệu trung bình đủ chính xác để sử dụng.

Trung bình, 4070 Ti sử dụng nhiều năng lượng hơn 11% so với 2080 Super trong các thử nghiệm 3DMark (Kiểm tra tính năng DXR đã bị bỏ qua cho phân tích này), nhưng mức cải thiện hiệu suất trung bình là 120% – do đó, các số liệu ‘Perf per watt’ ở trên .

Vì vậy, ngoài việc hài lòng với hiệu suất điện toán và tổng hợp, giờ là lúc xem xét khối lượng công việc kết xuất có trong trò chơi.

Đối với các bài đánh giá GPU mà bạn đọc trên TechSpot, hầu hết mọi kết quả điểm chuẩn đều đến từ việc lấy mẫu dữ liệu tốc độ khung hình trong quá trình chơi trò chơi thực tế, để cung cấp khối lượng công việc đồ họa chân thực nhất mà thẻ có thể trải nghiệm. Nhược điểm của việc sử dụng phương pháp này là nó rất tốn thời gian – bạn không thể để bài kiểm tra làm việc của nó trong khi bạn làm việc khác. Để đạt được mục tiêu đó, tôi đã lấy một bộ sưu tập các trò chơi cung cấp các chế độ điểm chuẩn tích hợp sẵn, chạy các chế độ đó và sử dụng CapFrameX để thu thập dữ liệu cần thiết (thay vì sử dụng số liệu thống kê được báo cáo của trò chơi).

svg+xml,%3Csvg%20xmlns= Từ 20 lên 40: Câu chuyện nâng cấp card đồ họa

Một khía cạnh khác cần lưu ý với điểm chuẩn tích hợp là tải đồ họa hiếm khi giống như trải nghiệm trong trò chơi. Ví dụ: trong Assassin’s Creed: Valhalla, camera xoay quanh một thị trấn, hiển thị một khung cảnh hoành tráng với khoảng cách vẽ rất lớn, nhưng khi bạn thực sự chơi tựa game này, camera hầu như luôn ở góc nhìn thứ ba cố định, chỉ cách mặt đất một chút. Vì vậy, mặc dù kết xuất không hoàn toàn đại diện cho chính trò chơi, nhưng nó vẫn đang sử dụng cùng một công cụ và quy trình đổ bóng.

Tất cả các thử nghiệm đều được chạy 5 lần, với dữ liệu sau đó được tính trung bình để tạo ra tốc độ khung hình thấp trung bình và 1%. Điểm chuẩn được thực hiện mà không kích hoạt tính năng nâng cấp, sau đó lặp lại đối với FSR và/hoặc DLSS được đặt thành Cân bằng. Cuối cùng, nơi một trò chơi hỗ trợ nó, HDR đã được bật.

svg+xml,%3Csvg%20xmlns= Từ 20 lên 40: Câu chuyện nâng cấp card đồ họa

Đầu tiên là trò chơi mà tôi vừa đề cập, trò chơi này sử dụng công cụ Anvil của Ubisoft cho tất cả các tác vụ dựng hình. Gói phần mềm này đã được sử dụng cho trò chơi Assassin’s Creed đầu tiên và qua nhiều năm, nó đã được cập nhật để bao gồm hầu hết mọi thủ thuật đồ họa trong cuốn sách (dò tia thanh).

Đọc thêm:  Điện thoại cũ vẫn được mua nhiều

Ở cài đặt chất lượng Cực cao, điểm chuẩn đã ảnh hưởng đến 2080 Super, nhưng việc áp dụng FSR 1.0 mang lại mức tăng rất cần thiết. Mặt khác, 4070 Ti đối phó hoàn toàn tốt, với mức cải thiện khung hình/giây trung bình khoảng 117% (có hoặc không bật FSR). Về mặt trực quan, nó trông đẹp hơn mà không cần nâng cấp, mặc dù việc đặt nó ở chế độ Chất lượng sẽ giúp ích rất nhiều.

Valhalla ban đầu được ra mắt mà không có bất kỳ tùy chọn nâng cấp nào, nhưng nó đã được thêm vào sau đó trong một bản vá; Ubisoft đã chọn không cập nhật công cụ để cung cấp bóng theo tia hoặc chiếu sáng toàn cầu. Thực sự là một lựa chọn hợp lý, vì nó không phải là một trò chơi chạy rất nhanh.

svg+xml,%3Csvg%20xmlns= Từ 20 lên 40: Câu chuyện nâng cấp card đồ họa

Tiếp theo, và cùng năm, là Horizon Zero Dawn của Guerrilla Games, sử dụng công cụ Decima của riêng họ. Giống như Valhalla, không có tính năng dò tia nhưng có ba tùy chọn nâng cấp được cung cấp.

Thử nghiệm cụ thể này đã trải qua rất nhiều lần chạy bổ sung và một số kiểm tra tỷ lệ độ phân giải, vì hành vi Thấp 1% đặc biệt kỳ quặc với 2080 Super. Sử dụng FSR hoặc DLSS với 4070 Ti giúp cải thiện tốc độ khung hình trung bình không quá 52% so với thẻ Turing. Vì vậy, những gì đang xảy ra ở đây?

Hóa ra điểm chuẩn tích hợp trong Horizon Zero Dawn khá nặng về CPU/hệ thống, bằng chứng là ở 720 p với tính năng nâng cấp, tốc độ khung hình trung bình và thấp 1% của 4070 Ti lần lượt là 70 và 138 – chỉ là một phần nhỏ thấp hơn ở 4K. Đây cũng là trường hợp trong quá trình chơi trò chơi thời gian thực, nhưng không có lúc nào trò chơi cảm thấy chậm chạp ở 4K khi nâng cấp.

svg+xml,%3Csvg%20xmlns= Từ 20 lên 40: Câu chuyện nâng cấp card đồ họa

Một tựa game khác của Ubisoft, nhưng lần này sử dụng công cụ Dunia của họ (bắt đầu hoạt động dưới dạng CryEngine được cập nhật). Truy tìm tia và nâng cấp đều là các tùy chọn, mặc dù tùy chọn trước chỉ được sử dụng cho bóng và phản xạ. Nó cung cấp một cải tiến rõ rệt cho hình ảnh ở một số khu vực nhưng nó không phải là thứ có thể thay đổi toàn bộ chế độ xem.

Bất kể sử dụng tính năng nâng cấp nào, 2080 Super đều xử lý 4K khá tốt, nhưng tính năng dò tia hoàn toàn giết chết nó – điều này gần như chắc chắn là do cài đặt đẩy yêu cầu VRAM lên trên 8GB có sẵn trên thẻ đó và công cụ không quản lý vấn đề này đúng cách. Với 12GB, 4070 Ti không gặp phải vấn đề này và chỉ giảm 17% tốc độ khung hình trung bình khi bật tính năng dò tia (và không nâng cấp).

Tuy nhiên, Far Cry 6 là một tiêu chuẩn khác có thể khá khắt khe đối với CPU/hệ thống. Giảm độ phân giải ngay xuống 720p, đồng thời bật cả RT và nâng cấp, dẫn đến mức Thấp 1% chỉ là 77 khung hình/giây và trung bình là 97. Không có tính năng dò tia, mọi thứ sẽ tốt hơn một chút, nhưng phần còn lại của PC của tôi hơi hạn chế.

svg+xml,%3Csvg%20xmlns= Từ 20 lên 40: Câu chuyện nâng cấp card đồ họa

Được phát triển bởi Eidos-Montréal, sử dụng công cụ nội bộ của riêng họ, Shadow of the Tomb Raider là một ví dụ về trò chơi có triển khai dò tia rất hạn chế – chỉ có bóng được thực hiện thông qua quy trình DXR và đó là một sự khác biệt nhỏ đến mức nó chỉ là không đáng kích hoạt nó. Tuy nhiên, RTX 2080 Super chắc chắn đã phải vật lộn với cài đặt này và ngay cả việc sử dụng DLSS cũng không giúp được gì nhiều.

GPU Ada Lovelace mới cũng ảnh hưởng đáng kể đến hiệu suất của nó, mặc dù việc nâng cấp đã kéo nó trở lại và khi được đặt ở chế độ Chất lượng, tốc độ khung hình và hình ảnh đều ổn. Trò chơi hoàn toàn ổn mà không có bóng siêu sắc nét ở khắp mọi nơi.

svg+xml,%3Csvg%20xmlns= Từ 20 lên 40: Câu chuyện nâng cấp card đồ họa

Một người sớm sử dụng RT khác là Wolfenstein: Youngblood, mục nhập hơi tầm thường trong loạt trò chơi về Thế chiến thứ hai xuất sắc khác. Không giống như các điểm chuẩn trước tiêu đề này, Youngblood sử dụng công cụTech 6 củaSoftware, chạy trên Vulkan và OpenGL (những công cụ khác sử dụng Direct3D). Điều đó có nghĩa là theo dõi tia được truy cập thông qua các tiện ích mở rộng API, theo lý thuyết, điều này sẽ mang lại hiệu suất tốt hơn.

Ngoại trừ điều đó không có trong trò chơi này và cũng giống như với Shadow of the Tomb Raider, hiệu ứng hình ảnh thu được không đáng để giảm tốc độ khung hình. Hoặc ít nhất đó là trường hợp của 2080 Super; mặt khác, thẻ mới có đủ hiệu suất vượt trội để không yêu cầu nâng cấp.

Đọc thêm:  Cách vào World of Warcraft năm 2018

Mức thấp 1% xuất hiện ở khắp mọi nơi trong điểm chuẩn này, đòi hỏi hàng chục lần chạy và những lần bị từ chối ngoại lai để có được bất kỳ hình thức nào của một thống kê phù hợp. Cho rằng con số này được cải thiện đáng kể, với cả hai thẻ, khi sử dụng DLSS, điều đó cho thấy rằng các biến thể này không phải là kết quả của tắc nghẽn CPU – đó rất là vấn đề về kết xuất.

svg+xml,%3Csvg%20xmlns= Từ 20 lên 40: Câu chuyện nâng cấp card đồ họa

Chernobylite là một tựa game gần đây, từ một nhóm phát triển nhỏ của Ba Lan và sử dụng Unreal Engine 4 để tạo ra một số cảnh quan thực sự ngoạn mục, đặc biệt là với cả HDR và dò tia đều được sử dụng. Có một cái giá phải trả cho tất cả các hình ảnh đẹp và thậm chí chiếm ưu tiên của điểm chuẩn đối với chế độ xem camera quét, thay vì vị trí người thứ nhất bình thường, hiệu suất của 4070 Ti không phải là tuyệt vời nhưng cũng không tệ.

Ngay cả DLSS trong chế độ Hiệu suất cũng không đủ để làm cho nó đáng để sử dụng RT – thực sự đáng tiếc, bởi vì đây là một trong số tương đối ít tựa game chứng minh cách dò tia thực sự có thể nâng cao chất lượng chiếu sáng toàn cầu. Việc xác định xem liệu đây có phải là giới hạn của GPU mới hay việc sử dụng UE4 không đáng để khám phá, vì các trò chơi mới với RT sử dụng công cụ của Epic sẽ sử dụng phiên bản 5.

svg+xml,%3Csvg%20xmlns= Từ 20 lên 40: Câu chuyện nâng cấp card đồ họa

Một động cơ khác, một tiêu chuẩn khác. Lần này là phần tiếp theo vụng về của Techland’s Dying Light. Việc sử dụng phương pháp dò tia không hoàn toàn hiệu quả như trong Chernobylite, mặc dù phong cảnh ban đêm với đèn pin rất ấn tượng. Hiệu suất? Không nhiều lắm.

Việc sử dụng RT, đặc biệt nếu trên nhiều hệ thống chiếu sáng (ví dụ: phản xạ, bóng tối, chiếu sáng toàn cầu) sẽ bổ sung thêm khá nhiều công việc để CPU xử lý, do đó tại sao việc sử dụng FSR/DLSS không giúp được gì nhiều cho con số thấp 1%.

Tuy nhiên, Dying Light 2 không thực sự cần tốc độ khung hình cực cao để có thể chơi được, mặc dù lối chơi parkour-n-zombies của nó. Vì vậy, mặc dù các số liệu trên trông không quá ấn tượng, nhưng hiệu suất trong trò chơi với tính năng dò tia có thể chấp nhận được với 4070 Ti. 2080 Super rõ ràng chỉ tạo ra những hình nền đẹp, cứ sau một giây hoặc lâu hơn.

svg+xml,%3Csvg%20xmlns= Từ 20 lên 40: Câu chuyện nâng cấp card đồ họa

Và để kết thúc, đó là tiêu chuẩn dò tia là Cyberpunk 2077. Chơi game ở 4K với 4070 Ti là điều không thể đạt được, có hoặc không có tính năng nâng cấp, nhưng RT hơi quá nhiều so với card đồ họa £800.

Điều đó không hoàn toàn công bằng, vì với một số điều chỉnh cài đặt và sử dụng FSR/DLSS ở chế độ Hiệu suất, cả điểm chuẩn và trò chơi đều chạy khá ổn định, mặc dù chỉ ở mức 60 khung hình/giây. Đối với một số người, điều đó là không đủ, đối với những người khác và bản thân tôi, tôi có thể đối phó với điều đó.

Mục đích của tất cả các thử nghiệm này là: (a) để đảm bảo thẻ thay thế hoạt động bình thường và (b) để xem liệu việc kết hợp các kết quả từ các đánh giá khác nhau có thể được sử dụng như một công cụ ước tính chính xác hợp lý về khả năng hay không. Nếu bạn nhớ lại trước đó trong bài viết này, việc sử dụng các đánh giá của Steve về thẻ Ampere và 4070 Ti đã đưa tôi đến con số +92%. Lấy ý nghĩa hình học của tất cả các điểm chuẩn trò chơi ở trên để đưa ra đánh giá cuối cùng này.

Một thử nghiệm đơn lẻ như thế này không đủ bằng chứng để hoàn toàn tin tưởng vào ước tính nhưng dữ liệu cho thấy điều đó gần như đúng – lý do tại sao mức tăng khung hình/giây trung bình không quá cao như mong đợi là do giới hạn của CPU trong một số bài kiểm tra.

Tất nhiên, chỉ nên bỏ qua các số liệu RT mà không cần nâng cấp vì RTX 2080 Super thường không thể chạy phần lớn các điểm chuẩn cụ thể đó vượt quá 1 hoặc 2 khung hình / giây. Nhưng khi việc sử dụng FSR và DLSS không thực sự giúp ích cho thẻ Turing cũ, thì thẻ Ada mới đặc biệt hoạt động tốt. Tốc độ khung hình trung bình và thấp 1% trung bình của nó lần lượt là 55 và 74, và điều đó đủ tốt đối với tôi.

Đọc thêm:  Lần cuối cùng Intel cố gắng tạo ra một card đồ họa

Vì vậy, tất cả chúng ta đã hoàn thành, phải không? Thời gian cho trà và bánh quy? Không chỉ được đưa ra.

Có một vài điều cần giải quyết trước khi kết thúc câu chuyện nâng cấp này và điều đầu tiên đối với tôi là đầu nối 12VHPWR chết tiệt đó. Zotac đã cung cấp một dongle PCIe 8 chân 3 chiều cùng với thẻ và nó có vẻ được làm tốt, có chiều dài phù hợp, v.v. Tuy nhiên, trong nhiều năm, tôi đã sử dụng các dây cáp nguồn PCIe bổ sung cho PSU Corsair RM1000 của mình.

Giải pháp duy nhất là lấy cáp 2 chiều PCIe-to-12VHPWR của Corsair để cấp nguồn – nó đủ dài, sử dụng cáp bện và rất vừa vặn nhưng tôi đã phải trả thêm £20 mà ban đầu tôi không mong đợi .

svg+xml,%3Csvg%20xmlns= Từ 20 lên 40: Câu chuyện nâng cấp card đồ họa

Vậy là card đồ họa MSRP £799 tổng cộng là £860 (840 cho card). Tôi không ngại trả giá cao cho các linh kiện PC nếu chúng phù hợp với vai trò mà tôi yêu cầu, nhưng chi phí bổ sung này có thể dễ dàng tránh được nếu Nvidia chỉ sử dụng đầu nối nguồn PCIe tiêu chuẩn. Với TDP 285W, hai ổ cắm 8 chân là quá đủ và PCB của thẻ đủ lớn để chứa chúng.

Mặc dù chúng tôi đang bàn về vấn đề giá cả, nhưng phần lớn quan điểm về thẻ giảm giá của 4070 Ti là nó quá cao đối với một mẫu 70-series và tôi hoàn toàn đồng ý với điều đó. Nó cao hơn ít nhất 33% so với 3070 Ti và cao hơn 60% so với 2070 Super. Nvidia ban đầu muốn tắt cái này đi tiếp thị GPU này như một sản phẩm loại 80 và trên cơ sở đó, MSRP của nó chỉ cao hơn 11% so với 2080 Super. Nhưng nó được cho là ‘cuối cùng’ 4080, không phải là Super mới.

svg+xml,%3Csvg%20xmlns= Từ 20 lên 40: Câu chuyện nâng cấp card đồ họa

Tất cả những gì đã nói, tôi không nghĩ rằng sẽ sớm có bất kỳ sự thay đổi mô hình nào về giá thị trường cho GPU (nếu có) và tôi không thực sự quan tâm nó được gọi là gì. Nvidia có thể đặt tên nó là RTX Slartibartfast cho tất cả những gì tôi quan tâm – đó là bộ tính năng và nâng cao hiệu suất mới là vấn đề quan trọng và cả hai đều nằm trong khung giá mà tôi sẵn sàng chấp nhận. Nếu gã khổng lồ xanh vẫn giữ nguyên kế hoạch ban đầu và phát hành nó với giá £899 4080, thì có thể tôi đã đi theo một lộ trình mới 3080 để thay thế.

Và nếu có hỗ trợ phần mềm tốt hơn cho card đồ họa của AMD, có lẽ tôi đã có một cái nhìn nghiêm túc về Radeon RX 7900 XT. Mặc dù hiệu suất dò tia của nó không mạnh bằng 4070 Ti, nhưng nó vẫn tốt hơn 2080 Super cũ của tôi và nó có nhiều hiệu năng tính toán và VRAM. Nhược điểm duy nhất là 7900 XT đắt hơn khoảng £ 60 đến £ 70 so với thẻ Nvidia, mặc dù tôi không cần cáp 12VHPWR.

svg+xml,%3Csvg%20xmlns= Từ 20 lên 40: Câu chuyện nâng cấp card đồ họa

Một tính năng mà tôi chưa đề cập đến cho đến nay là Tạo khung DLSS (còn gọi là DLSS 3). Đó là bởi vì tôi chỉ thử nó trong một tiêu đề (Spider-Man: Miles Morales) và thậm chí sau đó, đó là một phân tích rất chủ quan – về cơ bản, tôi chỉ kích hoạt nó và để chuyên gia Spidey của gia đình đưa ra ý kiến của cô ấy về cảm giác của nó/ nhìn. Tôi sẽ không lặp lại chính xác các cụm từ được thốt ra trong quá trình thử nghiệm nhưng tôi có thể diễn giải chúng bằng một từ: lag .

Trò chơi được chơi tốt nhất bằng bộ điều khiển và sau khi tự mình thử rồi sử dụng lại bằng bàn phím và chuột, tôi có thể đồng ý rằng có một sự chậm chạp rõ rệt. Nó không hoàn toàn là một sự chậm trễ thực sự trong việc di chuyển cần điều khiển và nhận được phản ứng trên màn hình; đó là một cảm giác hơn bất cứ điều gì khác. Tuy nhiên, việc chuyển sang chuột và bàn phím khiến nó ít được chú ý hơn. Khi có thời gian, tôi sẽ thử nghiệm nó trong một số tựa game khác, nhưng hiện tại không có nhiều tựa game hỗ trợ nó.

Và cùng với đó, đã đến lúc kết thúc câu chuyện nâng cấp này. Thẻ mới hoạt động như mong đợi (ít nhất là gần như vậy) và đó là một cải tiến rõ rệt so với 2080 Super – không chỉ về hiệu suất mà còn về hiệu quả và tiếng ồn. Thời gian để đưa nó vào làm việc!