Форумы-->Форум для внеигровых тем--> 1|2|3|4|5|6
Автор | Radeon vs NVIDIA |
и еще, зайти на оверов/хобот и почитать новости мы и сами можем, ты конкретно свои мысли высказывай
вот например:
с конца 2006 года рынок видиокарт очень сильно изменился, если абсолютная производительность росла очень медленно повысилась всего раза в 2(5870 vs 8800GTX), то цена/производительность росла гораздо быстрее чем с 2002-2006. в результате если ати/нв получают убытки обе. да, тут сыграл мировой кризис, но так пока что получаеться что в 2009 быгоднее было вобще не производить видиокарт, это нездоровая ситуация.
сравните 2004-2005: 6600gt 150мм2/128бит за 150-200$
2008-2009:9600gt 200мм2/256 бит за 80-100$(карты "достаточные абсолютному большенству")
Но похоже производители уже поняли что так они друг друга угробят, и начали потихоньку повышать цены на уже выпускаемые карты.
так что в 2010 такой халявы для покупателей как ранше уже не будет
ИМХО=) | фициальный релиз ATI Radeon HD 2900 Pro
вобще то 2900 xt был топом, и вышел в мае(должен был еще в 2006), а pro это отбросы производства и попытка побыстрее слить все чипы до прихода rv670
тоетсь разница 12-14 месяцев | Вообще то 5870 = 5Х8800GTX по производительности, это тоже что ровнять мою 3850, к Х800ХT.
Но похоже производители уже поняли что так они друг друга угробят, и начали потихоньку повышать цены на уже выпускаемые карты.
Скорее они несколько защитили себя от прихода Интеловского Larrabee, которой Интел намерен выкинуть и АТИ и NVIDIA, с рынков видио ускорителей. | 5870 = 5Х8800GTX
GTX280=8800GTX*1.6
5870=GTX280*1.4=8800GTX*1.6*1.4=2.24
ну лано, 2.5 раза на новых дровах, но никак не 5
лараби будет говном, тут даже думать нечего
по крайне мере первое поколение | для Suped:
лараби будет говном, вообще то NVIDIA строит Ферми схожим образом что и Интел лераби, Ферми тоже будет говно?
Вычислительная способность 5870 составляет 2,72 Терофлопса, GTX280 1,062 Терофлопс, при двойной точности 0,088 Терофлос, 8800GTX 0,518 Терофлопс. | для Рудольфо:
ТерАфлопс | для Рудольфо:
я говорю о реальной производительности в играх, а эти терафлопсы нахрен никому кроме тебя(ну и разве что учёных) не сдались | Повторю новость, а то утонет не замеченной в споре.
Начнем с АТИ:
Radeon HD 5970 c двумя GPU RV870 выходит завтра
Наконец стали известны окончательные спецификации Radeon HD 5970. Во-первых, карта должна выйти завтра, 18 ноября. Она будет самой быстрой видеокартой, по крайней мере, до тех пор, пока не появится NVIDIA Fermi.
Radeon HD 5970 оснащен двумя GPU RV870, которые работают на частоте 725 МГц, что на 125 МГц ниже, чем у Radeon HD 5870, но оба чипа предоставляют в общей сложности 3200 потоковых процессоров. На видеокарте установлено 2 ГБ видеопамяти GDDR5 (по 1 ГБ на каждый GPU).
Максимальное энергопотребление новинки составляет 294 Вт, а общая вычислительная мощность GPU составляет 4,64 ТФлопс.
А теперь наконец новость от NVIDIA, готовой предоставить первые карты на базе Fermi:
На SC09, проходящей в Портленде, NVIDIA показала свой продукт Tesla серии 20 для высокопроизводительного рынка, основанный на архитектуре Fermi:
- Поддержка стандарта следующего поколения IEEE 754-2008 для вычислений двойной точности с плавающей запятой
- Поддержка ECC (error correcting codes)
- Многоуровневая кэш-память (L1 и L2)
- Поддержка языка программирования C++
- Поддержка памяти до 1 ТБ
Первыми продуктами на базе Tesla серии 20 являются C2050 и C2070, а также системы S2050 и S2070. Они поддерживают интерфейс PCI-Express x16, занимают два слота в корпусе, оснащены 3 и 6 ГБ памяти GDDR5 соответственно.
Tesla C2050, C2070, S2050 и S2070 станут доступны во втором квартале 2010 года по ценам $2499, $3999, $12995 и $18995, соответственно. NVIDIA отметила также, что видеокарты GeForce на базе Fermi появятся в первом квартале 2010 года.
Компания отмечает, что процессоры Tesla на базе чипа Fermi предоставляют тот же уровень производительности, что и центральные процессоры при 1/20 энергопотребления и 1/10 стоимости.
Рудольфо
[>] [ц]
58 2009-11-17 17:20:23
В семейство Tesla 20 вошли четыре решения, различающиеся по своим характеристикам. К примеру, Tesla C2050 и C2070 представляют собой карты с шиной PCIe 2.0, имеющие до 3 Гб и 6 Гб “набортной” памяти GDDR5 и реализующие удвоенную точность операций с плавающий точкой в пределах производительности от 520 до 630 гигафопс.
В то же время Tesla S2050 и S2070 представляют собой решения для кластерных систем и дата-центров. Они вмещают до четырех чипов Tesla в стойке стандарта 1U и несут на борту до 12 Гб и 24 Гб памяти GDDR5 соответственно, а двойная точность операций с плавающий точкой реализуется в пределах производительности от 2,1 до 2,5 терафлопс. | NVIDIA снова уверила журналистов в своей сильной приверженности игровой индустрии. Браен Дел Риззо сказал TG Daily, что слухи, будто NVIDIA оставляет игры и уходит на рынок серверов и высокопроизводительных ПК (HPC) не имеют под собой основания и просто нелепы.
«Игры остаются нашими средствами к существованию. Однако, для нашего роста есть и другие области, в том числе и рынок HPC».
«Сейчас есть две стороны архитектуры Fermi — вычисления и графика. Прошедшая выставка HPC была полностью посвящена стороне вычислений, поэтому мы продемонстрировали именно процессоры Tesla (на базе Fermi)».
Также он отметил, что хотя NVIDIA ещё не представила подробные сведения о своих видеокартах GeForce, они будут вскоре опубликованы, а ожидание будет вознаграждено сторицей отличными возможностями видеокарт на основе Fermi.
Господин Дел Риззо не мог не сказать и о том, что компания вкладывает огромные средства в развитие игрового рынка, продвигая стерео-технологию 3D Vision, физические вычисления PhysX на множестве платформ и помогая разработчикам внедрять аппаратные физические эффекты. | люди помогите пожалуйста дайте прямую ссылку где можно скачать дрова на HD4850 512m GDDR3 PCI-E DUAL DVI_I\tvo а то сколько не пробовал не определяет видеокарту | а у меня на радеоне нфс 5 не идёт. | для Rihard_Zorge:
http://game.amd.com/us-en/drivers_catalyst.aspx | | Как уже было упомянуто, новый продукт под названием Radeon HD 2900 XT основан на графическом процессоре с кодовым названием R600, который обладает 320-ю унифицированными шейдерными конвейерами. Стоит отметить, что нельзя непосредственно сравнивать эти 320 конвейеров R600 со 128-ю конвейерами G80, поскольку отличия в их архитектуре более чем существенны. Об этом и в подробностях.
Как и в случае G80, каждый из шейдерных конвейеров R600 может выполнять одну операцию за такт. Дело в том, что конвейеры R600 не являются скалярными в широком смысле этого слова, так как они группируются в блоки по 5 штук. Каждый из этих 64 суперскалярных блоков может выполнять за такт одну скалярную операцию и одну векторизированную на 4-х конвейерах сразу. Теоретически одна такая векторизированная команда эквивалентна 4-м скалярным, но не всегда. Говоря простым языком, 4 одинаковые скалярные операции можно преобразовать в 1 векторизированную. Если же эти 4 скалярные операции отличаются по характеру, то такое преобразование невозможно. Это не имело бы никакого значения, если бы все операции с шейдерами были векторизированными, но на деле всё обстоит иначе, и прямая аналогия между 5-ю конвейерами ATI типа Vec 4+1 и 5-ю скалярными конвейерами NVIDIA просматривается далеко не всегда, поскольку в реальных приложениях доля независимых скалярных расчётов довольно значительна. Очевидно, что это негативно отражается на реальной производительности R600.
Какова же теоретическая производительность R600 с 64-ю шейдерными блоками Vec 4+1? Получается, что 47,3 млрд. векторных и столько же скалярных операций в секунду. В таком случае, в зависимости от соотношения количества скалярных и векторных операций в программе, превосходство R600 над G80 с его 43,2 млрд. векторных операций в секунду составит 9-19% при полной векторной нагрузке, а при полностью скалярной примерно двукратное превосходство получит G80. Как показывает практика, в общем случае суперскалярная архитектура R600 не имеет явного преимущества над скалярной архитектурой G80.
Суперскалярную архитектуру R600 унаследовали и новые графические процессоры, которые принадлежат к следующим поколениям видеокарт ATI, то есть HD 3xxx и HD 4xxx.
Несмотря на свою теоретическую шейдерную мощь видеокарты ATI на практике не столь сильны, как может показаться на первый взгляд. В современных играх значительную часть времени занимают скалярные расчёты, что снижает реальную производительность систем на основе видеокарт ATI. С другой стороны, оптимизация шейдерного кода позволяет минимизировать этот недостаток. Превосходство R600 в шейдерной производительности будет тем значительнее, чем сложнее (векторизированнее) будут шейдерные операции.
Примером может послужить сравнение видеокарт GeForce GTX 295 и Radeon HD 4870 X2. Продукт от NVIDIA основан на двух графических процессорах GT200b с 240-ю унифицированными скалярными шейдерными конвейерами каждый, в то время как решение от ATI содержит по 800 конвейеров в каждом из своих двух графических процессоров RV770. Но на самом деле HD4870 X2 имеет только 320 шейдерных блоков (по 160 на графический процессор), производительность которых на скалярных операциях существенно уступает производительности конкурента.
Отсюда ответ на вопрос, почему видеокарта с 480-ю шейдерными конвейерами побеждает видеокарту, у которой их 1600, звучит примерно так: видеокарты ATI Radeon обладают суперскалярной архитектурой, в отличие от видеокарт NVIDIA GeForce с их скалярной архитектурой, и реальное количество шейдерных блоков у видеокарт ATI значительно меньше заявленного количества конвейеров.
Что касается расчётной производительности GT300, то она в основной мере зависит от практической сбалансированности новой архитектуры и реально достижимой при массовом производстве частоты шейдерного домена. Ориентировочно последняя будет составлять от 1,5 ГГц до 2,0 ГГц, что даёт основание полагать о производительности от 2200 до 3000 Gflops на вещественных операциях одинарной точности и от 8 | Что касается расчётной производительности GT300 (по некоторым данным GF100), то она в основной мере зависит от практической сбалансированности новой архитектуры и реально достижимой при массовом производстве частоты шейдерного домена. Ориентировочно последняя будет составлять от 1,5 ГГц до 2,0 ГГц, что даёт основание полагать о производительности от 2200 до 3000 Gflops на вещественных операциях одинарной точности и от 800 до 1500 Gflops двойной точности. Что касается производительности предыдущих разработок, то Tesla C1060 на основе GT200 с тактовой частотой шейдерного домена в 1,3 ГГц характеризовался 933 Gflops одинарной точности и 78 Gflops двойной точности. Как видим, разница в производительности просто огромна, особенно на вещественных операциях двойной точности. Из существующих конкурентных разработок следует отметить AMD/ATI Radeon HD5870, в основе которого лежит 40-нанометровый графический процессор RV870 (Cypress), который при стандартной тактовой частоте в 850МГц обладает производительностью в 2720 Gflops одинарной точности и 544 Gflops двойной точности.
Из предыдущих разработок AMD/ATI в сфере научных расчётов стоит отметить FireStream 9270 на основе RV790, который при тактовой частоте в 850 МГц демонстрировал 1200 Gflops одинарной точности и 240 Gflops двойной точности. Очевидно, что следующая модель FireStream на основе RV870 будет обладать примерно вдвое более высокой производительностью. Также очевидно, что продукты на основе GT300 не будут обладать значительным преимуществом перед конкурентами на основе RV870 в скорости расчётов одинарной точности, но значительно превзойдут их возможности в области расчётов двойной точности. Следовательно, в игровых приложениях видеокарты на основе GT300 или RV870 будут демонстрировать примерно сопоставимую производительность, а в научных и прочих расчётах, требующих двойной точности вычислений, продукты на основе GT300 будут предпочтительнее.
Конкуренты
У архитектуры NVIDIA Fermi в ближайшем будущем появится ещё один серьёзный конкурент в виде архитектуры Intel Larrabee. Продукты на основе этой архитектуры пока что находятся в стадии разработки, поэтому доступная информация не несёт окончательного характера.
Достоверно известно, что в основе архитектуры лежит процессорное ядро Larrabee, которое состоит из 64-битного скалярного блока, 512-битного векторного блока, двух файлов регистров (по одному на скалярный и векторный конвейер), блока декодирования команд, разделённой кэш-памяти для данных и команд по 32Кб каждая, блока по работе с кэш-памятью 2-го уровня и межядерной шиной, а также некоторой вспомогательной логики. Хотя кэш-память 2-го уровня логически является общей для всех ядер, каждое из них обладает быстрым доступом в локальный сегмент размером в 256 Кб. Передача данных между отдельными сегментами кэш-памяти происходит по высокоскоростной межядерной двойной кольцевой шине. Передача данных по этим кольцам, каждое из которых имеет разрядность в 512 бит, происходит в противоположном направлении. Они также служат для обмена данными с видеопамятью и периферийными контроллерами.
В основе скалярного блока Larrabee лежит целочисленная логика процессора Intel Pentium, который не обладал RISC-подобным ядром и не мог выполнять x86 команды вне очереди. В него была добавлена поддержка 64-битных команд, многопотокового выполнения, предварительной выборки и некоторых дополнительных функций. Векторный блок Larrabee состоит из 16 32-битных конвейеров, каждый из которых может выполнять как целочисленные команды, так и вещественные одинарной точности. С некоторой потерей производительности смогут выполняться и вещественные команды двойной точности.
Новые команды для векторного блока позволяют работать максимум над 3 исходными операндами, что даёт возможность реализовать сложные операции типа умножения с последущим сложением (multiply and add, MAD) или совмещенного умножения со сложением (fused multiply and add, FMA), при котором данные после умножения не округляютс | Профессиональные Quatro 3800 рулят цена качество!!!
Ибо по работе надо, а стоит GF8800:( хотя справляется. | Новые команды для векторного блока позволяют работать максимум над 3 исходными операндами, что даёт возможность реализовать сложные операции типа умножения с последущим сложением (multiply and add, MAD) или совмещенного умножения со сложением (fused multiply and add, FMA), при котором данные после умножения не округляются перед последующим сложением. Соответсвенно, архитектура Intel Larrabee будет полностью соответствовать требованиям стандарта IEEE 754-2008 в части вещественных вычислений одинарной и двойной точности. Впрочем, как и архитектура NVIDIA Fermi.
В архитектуре Larrabee почти все традиционные графические задачи (растеризация, интерполяция, альфа-смешивание, пр.) выполняются не специализированной логикой, а программно на векторных блоках. Исключение составляет лишь текстурная фильтрация, которая выполняется аппаратно. Поскольку современные программы работают преимущественно с текстурами, характеризующимися 8-битными каналами данных, поэтому обработка их на 32-битных конвейерах была бы малоэффективной. Впрочем, при необходимости текстурную фильтрацию можно проводить и программно. Каждое ядро обладает кэш-памятью для текстур размером в 32 Кб. Обмен данными между основными блоками ядра и блоком текстурной фильтрации происходит через кэш-память 2-го уровня.
Заключение
Предварительные тесты показали, что для достижения приемлемого уровня производительности (разрешение 1600х1200, 60 кадров в секунду) в популярных играх 2008 года (F.E.A.R., Helf-Life 2 Episode 2, Gears of War) достаточно 24 ядер Larrabee, работающих с тактовой частотой в 1,0 ГГц. Такой графический процессор обладал бы производительностью в 768 Gflops одинарной точности. Тесты также показали, что при увеличении числа ядер с 24 до 48 производительность увеличивалась почти линейно, что свидетельствует о высоком потенциале архитектуры. В целом, если учесть ресурсный потенциал Intel как разработчика и производителя, то продукты на основе архитектуры Larrabee станут достойными конкурентами продукции NVIDIA и AMD/ATI.
Это одна из причин, по какой NVIDIA следует поспешить с выпуском GT300. Что касается позиционирования будущих продуктов на основе GT300 преимущественно на рынок на рынок суперкомпьютеров и прочих высокопроизводительных расчётных решений, то следует учесть тот факт, что в этом году примерно 2/3 прибыли компании принесли решения семейства Quadro и Tesla, поэтому ориентация на эти семейства в ближайшем будущем очевидна. Жёсткая конкуренция на рынке игровых видеокарт, мировой экономический кризис, неудачи с DirectX 10 и Windows Vista привели к тому, что норма прибыли на этом рынке упала до очень низкого уровня, граничащего с нерентабельностью. Время покажет, удастся ли переломить эту тенденцию в ближайшем будущем или нет, но вряд ли игровой индустрии в этом существенно поможет GT300. | для Рудольфо:
перевожу:
у нв процессоры работают на удвоенной+ частоте, а у ати способны выполнять по 5 операций за такт
для сравниния видиокарт разных произвадителей число sp у ати надо делить на 5, а у нв брать частоту ядра, а не частоту sp. тогда они примерно равны(128*740 у gts250 ~ 160*625 у 4850) | Дефицит 40 нм GPU продолжится и дальше
Производство чипов по 40 нм техпроцессу на фабриках TSMC можно описать одним словом - плохо. Согласно новым данным, выход годных чипов не превышает 50%.
К этому времени у TSMC данный показатель просто обязан был находиться на отметке 90%. Самым худшим является то, что ситуация не сдвинется с мертвой точки вплоть до января 2010 года. Пострадает и AMD, и NVIDIA (которая захочет к тому времени активно выпускать Fermi). | Купил Nvidia GeForce GTX 260
Имхо, у неё лукчшее соотношение цена/качество среди Нвидиа.
Брать GTS 250 или GTX 275 смысла нет.
А к радеону как-то не очень отношусь. |
1|2|3|4|5|6К списку тем
|