Byte News

Thursday, October 01, 2009

GT300 ou GF100: detalhes das características e arquitetura


Após o lançamento das soluções AMD Radeon HD 5800 a atenção gradualmente volta-se à resposta da NVIDIA através de um certo chip GT300. Informações sobre o futuro chip high-end que a NVIDIA está preparando para o anúncio começaram a aparecer.

Vamos começar sobre o atual codinome GT300. Na verdade ele será batizado como GF100. A pergunta que deve estar pairando na cabeça é “Por que?” Primeiramente, após o lançamento do chip high-end G92 a NVIDIA decidiu alterar a nomenclatura de suas placas gráficas baseadas no chip GT200. Na época, a letra “T” do codinome do chip GT200 passava despercebido e aparentemente não havia significado. Mas há. Esse “T” significa Tesla e 200, supostamente, é a versão dessa arquitetura (2.0). Isso significa que Tesla não é apenas um nome comercial para aceleradores baseados nesse chip, mas também o batismo da arquitetura computacional utilizada. O novo chip NVIDIA terá uma nova arquitetura chamada Fermi e seu codinome GF100 pode ser traduzido como Fermi 1.0. A letra “G” possivelmente indica GeForce ou Graphics.

Apesar dos muitos boatos contraditórios sobre as características do chip, as informações mais plausíveis caíram nas mãos dos correspondentes do Overclockers.ru e são as seguintes:
  • 3 bilhões de transistores;
  • 512 processadores de fluxo ou CUDA Cores na terminologia NVIDIA;
  • 128 blocos de texturização (TMU);
  • 48 blocos de rasterização (ROP);
  • Barramento de 384 bits com suporte a memórias GDDR5;
  • Suporte a um total de 6 GB de memória de vídeo instalada;
  • Suporte a ECC;
  • Nova arquitetura Fermi;
  • Suporte a DirectX 11;
  • Dois links de fluxo;
  • Ausência de bloco de tesselation, essa função será coordenada por software;
  • Consumo de energia de aproximadamente 200 W.

A Fermi é considerada pela NVIDIA como a mais importante renovação de arquitetura desde o lançamento do chip G80 (GeForce 8800 GTX). Então o que há de novo?
  • Processadores de fluxo (CUDA Cores): Para o GF100, essa quantidade é composta por 512 unidades e ao contrário do GT200, agora os cálculos de pontos flutuantes de simples (FP32) e dupla (FP64) precisões utilizam os mesmos blocos. Com o uso de FP64, o tempo de trabalho é reduzido pela metade e garante até 256 cálculos de dupla precisão durante o mesmo intervalo de tempo. No GT200, para nível de comparação, apenas 30 desses blocos são encarregados para cálculos similares. Além disso, cada CUDA Core inclui dispositivos capazes de efetuar operações com ponto flutuante e outros para operações integrais com meticulosidade de 64 bits. Todos os cálculos são processados ao mesmo tempo. Não há a divisão de blocos para operações especiais (SFU), os quais possibilitam calcular seno, cosseno, raiz quadrada e outras funções complexas. Se anteriormente a relação entre SP e SFU era 4 para 1, agora cada SFU equivale a 8 SP, ou seja, duas vezes maior. Por outro lado, sua produtividade é multiplicada por 4.
  • A organização hierárquica do chip foi alterada. Se anteriormente a unidade de base TPC (textural processor cluster) continha 8 blocos de textura e 3 unidades de processamento SM, agora há 32 unidades de fluxo ao invés de 8. O GF100 (GT300) inclui 16 blocos SM, cada qual consiste em 2 x 16 CUDA Cores, 16 blocos de carregamento e descarregamento de dados (LSU) e 4 SFU;
  • Dois links de fluxo em cada SM. A tecnologia é análoga ao HyperThreading da Intel, mas aplicada na GPU, dando agilidade no carregamento de dados e consequentemente, no desempenho como um todo;
  • A GPU contém caches L1 com volume total de 1 MB e de cache L2, 768 KB.

Nota-se que as numerosas mudanças relacionadas podem garantir um acréscimo na eficiência de cálculos dedicados GPGPU. Entretanto, essa renovação de arquitetura também deverá favorecer aplicativos 3D. Vale ressaltar que desta vez não se trata de uma arquitetura “requentada” da original estreada pelo chip G80 e sim uma totalmente nova. Informações mais frescas serão publicadas à medida que surgirem.

No comments:

Wikipedia

Search results

ByteNews

Bytenews