< p>Похоже на буллщит, по крайней мере по флопсам нифига не сходится, RV770@766мгц.(10^6Гц.)= 800*766*2*10^6=1226000*10^6 flops или 1226 Gflops против 1398 гигафлопс выше, ай-я-яй, фейл, пересчитаем, может там другое кол-во SP, 1398000/2/776=900.77, снова невозможное число для подобной конфигурации, вывод - либо вся новость фейк, либо ошиблись с тактовой частотой, которая должна составлять 874 Мгц
С чего вы взяли, что флопсы в любом случае буллщит? Посчитать таковые любой карты, зная ее конфигурацию, проще-простого
Если рисунок выше якобы оффициальный утекший "секретный" слайд нин, то весьма забавно, если в нем не сходятся указанные величины. По мне так спеки чуть менее чем полностью буллщитовые
< p>Андерсон - молодец, все правильно сделал, а как еще отвечать на дурацкие вопросы, когда в открытом доступе имеются его презентации в которых разбирается всё, вплоть до оптимизаций участков кода на SPA!(что присутствует далеко не во всех PS3 экзах, а отложенного шейдинга на SPU так и вовсе нигде боле нет) Вовсе необязательно тратить силы и нервы на вдалбливание информации очередному нерадивому фанатику, когда достаточно лаконичного: "Bullsh*t". Кто лоханулся, так это менеджеры ЕА, ибо нефик публично демонстрировать недопиленные альфа версии, в которые, судя по видео, не успели прикрутить и половины заявленных граф. фичь(что, впрочем, не значит, что таковые не докрутят к релизу, т.к. многие из них до сих пор в процессе верификации, взять хоть тот же fxaa, который до сих пор в разработке и пока еще не прикручивался)
Вот кстати Parallax Occlusion Mapping, придуманная CryTek и то полезнее, чем эта технология. Рисует не менее красивую землю, зато полигональную и в реалтайме.
Parallax Occlusion Mapping - пиксельный шейдер, соответственно данные берет из текстур и отображается в плоскости растеризированного тр-ка, изменить уже растеризированную геометрию в пиксельном шейдере никак нельзя, можно лишь изменить отображение текстур в зависимости от угла к камере в плоскости полигона конечно, чем Parallax Occlusion Mapping шейдер и занимается, под острыми углами на краях геометрии таковой ничем не поможет.
В вокселях или всяких point based форматах представления сцены также ничего нового, все проблемы как и прежде - на месте, например сколько будет занимать моделька разрешения 2560 точек в кубе (2560^3) * 32 бита точности цвета каждый может посчитать сам, современные карты сильно ориентированные на мат. вычисления будут задыхаться от нехватки псп, не говоря уже об отсутствии у современных карт каких-либо аппаратных блоков для ускорения воксельных конвейеров. Ни инструментов(софта), ни железа, ничего за вокселями не стоит, скорее мы увидим субпиксельные тр-ки полученные тесселяцией с процедурными картами смещений для бесконечной детализации(легко может стать развитием DX11 тесселяции), нежели чьи-то фантазии с вокселями
Ну, собсно формат хранения и вывода таких данных они демонстрируют на видео - придумали как срезать значит
Такие форматы обычно хорошо подходят для статики, но как они собираются использовать воксели для анимированной геометрии?
Ну и судя по видео у них все достаточно просто, у каждого воксельного массива может быть несколько лодов(едва ли там используется октри дерево для динамического лода как у Кармака), потом какой-нить глобальный трехмерный массив генерящийся процедурно(вроде пирамидок из статуй или что там было на видео) или в редакторе, хранит информацию о том где и какой воксельный массив должен быть, судя по тому что они показали все должно быть примерно так. Все-равно, тонны статичной не освещенной геометрии не впечатляют ни чуть и никаких перспектив для вокселей пока не видно
1) Процессор - нигде не указана тактовая частота, видимо на то несколько причин, во первых, во всех нынешних SoC(смартов и табов) основной потребитель энергии - cpu ядра, им обычно отводится наибольший бюджет по питанию, а Вита девайс все-таки игровой, потому частотой процессора наверняка пренебрегут в пользу частоты графики, во вторых, основная составляющая потребления - напряжение(т.к. в ф-ле динамического потребления оно в кубе, в отличие от частот и кол-ва активных эл-тов), которое достаточно давно(с техпроцессов предыдущего поколения) перестало линейно скейлится с техпроцессами, поэтому с т.з. характеристик большее число транзисторов(больше ядер) на меньшее напряжение(уменьшает тактовую частоту) -- лучшие характеристики энергопотребления относительно меньшего числа транз(меньше ядер) на большее напряжение(большая частота), т.е. можно сделать грубое(без расчетов) предположение, что вопреки интуиции здешнего большинства 4 ядра на 600-800 Мгц(меньшая частота - меньшее напряжение) будут потреблять меньше чем нынешние двухъядерные гигагерцовые и более SoC'и(которые в свою очередь по ряду причин потребляют даже меньше чем одноядерные 1Ггц. решения пред. поколений на А8)
800Мгц. - мой прогноз частоты ЦПУ Виты(для сравнения макс. частота А5 опять же вопреки мнению большинства лишь 900Мгц.), пиковая и однопоточная произв. цпу будет где-то в полтора раза меньше таковой у планшетов на Т3(ожидаемые частоты 1.3-1.5Ггц.), ну и ежу понятно, что семи SPU Целла по FP моще процессор Виты с 4мя Неонами(векторными блоками, аналогами SSE) не товарищ(процессор Виты слабее раз так в десять), по целочисленной же моще во многих случаях четыре 2-way OoO ядра А9 даже на 800Мгцах могут оказаться быстрее одного достаточно тормозного(в плане задержек) 3.2Ггц. 2-way in-order PPU Целла(но для игровых задач все-таки важнее FP моща)
2) Графика - опять же не указаны ни частоты, ни параметры ГПУ, частоты по грубым прикидкам, за счет экономии на ЦПУ могут быть относительно высокими - 300-400Мгц.(SGX543MP2+ А5 работает на частоте около 250Мгц.+-10%, GeForceULP Т2 - 300-400Мгц. для смартов и табов соответственно).
Касательно параметров данных мало, но тесты второго япада намекают, что в нём 4TMU(4*250=1 теоретический гигатексель в секунду или 890 реальных мегатекселей в тесте, т.к. кпд не может быть 100% из-за пропускной способности и особенностей самих тестов), значит у ГПУ Виты 8TMU и произв на уровне от 2400 до 3200 теоретических мегатекселей, не густо на фоне RSX'а с 13.2 теор. гигатекселями при мультитекстурировании(близкая к пиковой производительность достигается только при мультитекстурировании из-за втрое меньшего числа блоков закраски - РОПов относительно ТМУ).
Со скоростью закраски у ГПУ Виты дела должны обстоять веселее(т.к. в SoC'ах баланс ТМУ:РОПы пока 1 к 1), учитывая КПД тайловой отложенной архитектуры SGX и меньшее разрешение, скорость закраски может достигать таковой у RSX'а(2.4-3.2 гигапикселя/сек. на разрешение 522К пикс. у Виты против 4.4 гигапикселя на 921К пикс. у ЗЫ3, плюс больший КПД гпу виты), т.к. пиксельные фрагменты у SGX сортируются и компонуются в тайлы для избежания фильтрации, шейдинга, закраски невидимых фрагментов, таким образом обрабатываются только видимые пиксели, еще одна прелесть тайловых архитектур в минимизации числа обращений к внешней памяти благодаря использованию начиповой SRAM памяти для хранения всех необходимых ресурсов для шейдинга/закраски в пределах NxN группы пикселей(в Вите это 32х32 пикселя), которая и называется тайлом, хотя как обычно имеется оборотная сторона медали, память на чипе и логика для сортировки кушают транзисторы которые могли бы пойти на выч. блоки(но это своего рода мобильный трэйдофф в силу ограниченности псп и энергопотребления), в результате по части голой шейдерной мощи гпу Виты совсем отсталый на фоне RSX'а, если верить ребяткам ананда, у SGX543MP2 максимум 19.2 гигафлопсов мощи при 300Мгц, основываясь на их таблице у Виты будет вдвое больше на той же частоте или 51.2 на 400та Мгцах против 246 гигафлопса RSX'а.
По части геометрии Вита должна быть также весьма слаба, блок установки тр-ков в SGX работает со скоростью 9ть тактов на тр-к, всего таких блоков 4ре в SGX543MP4+, таким образом максимальная пропускная способность - 133 млн. тр-ков в сек на 300Мгцах или 177 млн. тр-ков на 400Мгц., кол-во геометрии будет также ограничивать необходимость стримить таковую в параметрический буфер во внешней памяти перед растеризацией(следовательно чем больше геометрии тем жестче требования к ограниченной пропускной способности внешней памяти), это особенность всех тайловых архитектур(расчет на ворклоады с преобладанием пиксельной нагрузки), также у Виты куда меньше процессорной мощи для анимации, отсечений невидимой геометрии, батчинга, геометрия будет однозначно проще чем в играх текущего поколения десктопных консолей.
< p>Забыл еще написать, что все это счастье(SoC Виты) по моим прикидкам будет иметь площадь в районе 200 квадратных миллиметров на 45nm техпроцессе Самсунга(если не ошибаюсь на нем же вроде планируют производить), если слухи о цене в 300$ подтвердятся, то значит консоль будет продаваться на грани себестоимости
Вики подсказывает, что аппаратное декодирование третьей тегры уже дружит далеко не со всеми популярными кодеками. А это и означает то, что я написал ниже.
В таком случае 4ре НЕОНа должны помочь с софтовым декодированием
< p>Вот жеж придирасты, сопромат им подавай=), вам поди невдомек, что сопротивление материалов не рассчитывается ни одним игровым физ. движком, т.к. симуляция подобной сложности требует куда больших ресурсов чем могут дать нынешние карты по отдельности взятые. Обычно в играх то как будет складываться здание зависит исключительно от дизайнера, дело солвера твердых тел лишь посчитать пересечения таковых, ну а в данном случае и вовсе демонстрация процедурных разрушений, генерящихся на лету без какого-либо участия артистов, имхо, отличная штука которая упростит контент пайплайн для физики, ибо достаточно маркнуть материал как разрушаемый и физ. движок сам рассчитает на какие куски распадется этот материал и коллижены для этих кусков. В обновлении Hawken'а оно уже будет использоваться - http://www.youtube.com/watch?v=Lg5OsMdtJMA
< p>Тест на совместимость, а не производительность.
Производительность Javascript - SunSpider, Mozilla Kraken, Browsermark, WebXPRT и т.д.
Вряд ли ЗЫ4 с кастомным браузером покажет результаты лучше нетбучного А4 5000 с Хромом, который в свою очередь медленнее многих планшетных и даже смартфонных процов)
AMD'ешный A4-5000 на той же архитектуре Jaguar, что и в консолях, с частотой на 100 Мгц. меньше(1,5 Ггц.) проходит Kraken за 6512,7 ms в том же Хроме - http://images.anandtech.com/graphs/graph6974/54812.png (та скорость, до которой консольные браузеры допиливать и допиливать)
Стоит оговориться, что данные тесты - однопоточные и показывают производительность связки софт + процессор на одном потоке, но результаты как ящика, так и ЗЫ4 - одинаково позорные, даже дешевые Китайские смартфоны со стандартным Андроидовским браузером показывают результаты лучше.
Странно, конечно, что Мелкомягкие так облажались, учитывая, что Виндовские сборки IE работают на порядок быстрее с JavaScript на том же A4-5000 с 1,5 Ггц. Ягуаром, который в консолях(в консолях +100 Мгц., но это мизер)
< p>Всем, кто пустословит про жопорукость разрабов, рекомендую прочитать все доклады юбиков с gdc14 и недавнего digital dragons, в частности этот доклад лид. программиста Монреальской студии - http://michaldrobot.files.wordpress.com/2014/05/gcn_alu_opt_digitaldragons2014.pdf , оптимизировали вплоть до ассемблера, не поленились даже написать реализацию InvSqrt(), которая вдвое быстрее аппаратного вычисления корней, что помогло ускорить на ~13% HBAO+, который сам по себе самый быстрый алгоритм в индустрии(т.к. самый когерентный с т.з. использования кэша)
С чего вы взяли, что флопсы в любом случае буллщит? Посчитать таковые любой карты, зная ее конфигурацию, проще-простого
Если рисунок выше якобы оффициальный утекший "секретный" слайд нин, то весьма забавно, если в нем не сходятся указанные величины. По мне так спеки чуть менее чем полностью буллщитовые
Супер очепятка, лучше и придумать сложно)
Parallax Occlusion Mapping - пиксельный шейдер, соответственно данные берет из текстур и отображается в плоскости растеризированного тр-ка, изменить уже растеризированную геометрию в пиксельном шейдере никак нельзя, можно лишь изменить отображение текстур в зависимости от угла к камере в плоскости полигона конечно, чем Parallax Occlusion Mapping шейдер и занимается, под острыми углами на краях геометрии таковой ничем не поможет.
В вокселях или всяких point based форматах представления сцены также ничего нового, все проблемы как и прежде - на месте, например сколько будет занимать моделька разрешения 2560 точек в кубе (2560^3) * 32 бита точности цвета каждый может посчитать сам, современные карты сильно ориентированные на мат. вычисления будут задыхаться от нехватки псп, не говоря уже об отсутствии у современных карт каких-либо аппаратных блоков для ускорения воксельных конвейеров. Ни инструментов(софта), ни железа, ничего за вокселями не стоит, скорее мы увидим субпиксельные тр-ки полученные тесселяцией с процедурными картами смещений для бесконечной детализации(легко может стать развитием DX11 тесселяции), нежели чьи-то фантазии с вокселями
Такие форматы обычно хорошо подходят для статики, но как они собираются использовать воксели для анимированной геометрии?
Ну и судя по видео у них все достаточно просто, у каждого воксельного массива может быть несколько лодов(едва ли там используется октри дерево для динамического лода как у Кармака), потом какой-нить глобальный трехмерный массив генерящийся процедурно(вроде пирамидок из статуй или что там было на видео) или в редакторе, хранит информацию о том где и какой воксельный массив должен быть, судя по тому что они показали все должно быть примерно так. Все-равно, тонны статичной не освещенной геометрии не впечатляют ни чуть и никаких перспектив для вокселей пока не видно
1) Процессор - нигде не указана тактовая частота, видимо на то несколько причин, во первых, во всех нынешних SoC(смартов и табов) основной потребитель энергии - cpu ядра, им обычно отводится наибольший бюджет по питанию, а Вита девайс все-таки игровой, потому частотой процессора наверняка пренебрегут в пользу частоты графики, во вторых, основная составляющая потребления - напряжение(т.к. в ф-ле динамического потребления оно в кубе, в отличие от частот и кол-ва активных эл-тов), которое достаточно давно(с техпроцессов предыдущего поколения) перестало линейно скейлится с техпроцессами, поэтому с т.з. характеристик большее число транзисторов(больше ядер) на меньшее напряжение(уменьшает тактовую частоту) -- лучшие характеристики энергопотребления относительно меньшего числа транз(меньше ядер) на большее напряжение(большая частота), т.е. можно сделать грубое(без расчетов) предположение, что вопреки интуиции здешнего большинства 4 ядра на 600-800 Мгц(меньшая частота - меньшее напряжение) будут потреблять меньше чем нынешние двухъядерные гигагерцовые и более SoC'и(которые в свою очередь по ряду причин потребляют даже меньше чем одноядерные 1Ггц. решения пред. поколений на А8)
800Мгц. - мой прогноз частоты ЦПУ Виты(для сравнения макс. частота А5 опять же вопреки мнению большинства лишь 900Мгц.), пиковая и однопоточная произв. цпу будет где-то в полтора раза меньше таковой у планшетов на Т3(ожидаемые частоты 1.3-1.5Ггц.), ну и ежу понятно, что семи SPU Целла по FP моще процессор Виты с 4мя Неонами(векторными блоками, аналогами SSE) не товарищ(процессор Виты слабее раз так в десять), по целочисленной же моще во многих случаях четыре 2-way OoO ядра А9 даже на 800Мгцах могут оказаться быстрее одного достаточно тормозного(в плане задержек) 3.2Ггц. 2-way in-order PPU Целла(но для игровых задач все-таки важнее FP моща)
2) Графика - опять же не указаны ни частоты, ни параметры ГПУ, частоты по грубым прикидкам, за счет экономии на ЦПУ могут быть относительно высокими - 300-400Мгц.(SGX543MP2+ А5 работает на частоте около 250Мгц.+-10%, GeForceULP Т2 - 300-400Мгц. для смартов и табов соответственно).
Касательно параметров данных мало, но тесты второго япада намекают, что в нём 4TMU(4*250=1 теоретический гигатексель в секунду или 890 реальных мегатекселей в тесте, т.к. кпд не может быть 100% из-за пропускной способности и особенностей самих тестов), значит у ГПУ Виты 8TMU и произв на уровне от 2400 до 3200 теоретических мегатекселей, не густо на фоне RSX'а с 13.2 теор. гигатекселями при мультитекстурировании(близкая к пиковой производительность достигается только при мультитекстурировании из-за втрое меньшего числа блоков закраски - РОПов относительно ТМУ).
Со скоростью закраски у ГПУ Виты дела должны обстоять веселее(т.к. в SoC'ах баланс ТМУ:РОПы пока 1 к 1), учитывая КПД тайловой отложенной архитектуры SGX и меньшее разрешение, скорость закраски может достигать таковой у RSX'а(2.4-3.2 гигапикселя/сек. на разрешение 522К пикс. у Виты против 4.4 гигапикселя на 921К пикс. у ЗЫ3, плюс больший КПД гпу виты), т.к. пиксельные фрагменты у SGX сортируются и компонуются в тайлы для избежания фильтрации, шейдинга, закраски невидимых фрагментов, таким образом обрабатываются только видимые пиксели, еще одна прелесть тайловых архитектур в минимизации числа обращений к внешней памяти благодаря использованию начиповой SRAM памяти для хранения всех необходимых ресурсов для шейдинга/закраски в пределах NxN группы пикселей(в Вите это 32х32 пикселя), которая и называется тайлом, хотя как обычно имеется оборотная сторона медали, память на чипе и логика для сортировки кушают транзисторы которые могли бы пойти на выч. блоки(но это своего рода мобильный трэйдофф в силу ограниченности псп и энергопотребления), в результате по части голой шейдерной мощи гпу Виты совсем отсталый на фоне RSX'а, если верить ребяткам ананда, у SGX543MP2 максимум 19.2 гигафлопсов мощи при 300Мгц, основываясь на их таблице у Виты будет вдвое больше на той же частоте или 51.2 на 400та Мгцах против 246 гигафлопса RSX'а.
По части геометрии Вита должна быть также весьма слаба, блок установки тр-ков в SGX работает со скоростью 9ть тактов на тр-к, всего таких блоков 4ре в SGX543MP4+, таким образом максимальная пропускная способность - 133 млн. тр-ков в сек на 300Мгцах или 177 млн. тр-ков на 400Мгц., кол-во геометрии будет также ограничивать необходимость стримить таковую в параметрический буфер во внешней памяти перед растеризацией(следовательно чем больше геометрии тем жестче требования к ограниченной пропускной способности внешней памяти), это особенность всех тайловых архитектур(расчет на ворклоады с преобладанием пиксельной нагрузки), также у Виты куда меньше процессорной мощи для анимации, отсечений невидимой геометрии, батчинга, геометрия будет однозначно проще чем в играх текущего поколения десктопных консолей.
В общем, отписался, выводы делайте сами)
На Чичикова)
В таком случае 4ре НЕОНа должны помочь с софтовым декодированием
Производительность Javascript - SunSpider, Mozilla Kraken, Browsermark, WebXPRT и т.д.
Вряд ли ЗЫ4 с кастомным браузером покажет результаты лучше нетбучного А4 5000 с Хромом, который в свою очередь медленнее многих планшетных и даже смартфонных процов)
И чему вы радуетесь?
Для сравнения мой Galaxy Note 3 проходит Sunspider за 560 ms, Kraken за 7000 ms в Хроме
Shield на 1.9 Ггц. Cortex A15 за 512 ms и 4900 ms соответственно, опять же в Хроме, можете проверить на моем канале - http://www.youtube.com/watch?v=eiMicfmH9y8
AMD'ешный A4-5000 на той же архитектуре Jaguar, что и в консолях, с частотой на 100 Мгц. меньше(1,5 Ггц.) проходит Kraken за 6512,7 ms в том же Хроме - http://images.anandtech.com/graphs/graph6974/54812.png (та скорость, до которой консольные браузеры допиливать и допиливать)
Стоит оговориться, что данные тесты - однопоточные и показывают производительность связки софт + процессор на одном потоке, но результаты как ящика, так и ЗЫ4 - одинаково позорные, даже дешевые Китайские смартфоны со стандартным Андроидовским браузером показывают результаты лучше.
Странно, конечно, что Мелкомягкие так облажались, учитывая, что Виндовские сборки IE работают на порядок быстрее с JavaScript на том же A4-5000 с 1,5 Ггц. Ягуаром, который в консолях(в консолях +100 Мгц., но это мизер)
Номура просто вдохновлялся костюмом Клуни-Бэтмана
Больше интересно на кой у нее пистолет, да еще по правую когтистую руку, лол