AMD PowerTune

AMD PowerTune
AMD PowerTune
Empresa de design
Advanced Micro Devices
Introduzido
Dezembro de 2011
Tipo
Escala de frequência dinâmica

AMD PowerTune é uma série de tecnologias de dimensionamento dinâmico de frequência incorporadas em algumas GPUs e APUs AMD que permitem que a velocidade do clock do processador seja alterada dinamicamente (para diferentes estados P) pelo software. Isso permite que o processador atenda às necessidades instantâneas de desempenho da operação que está sendo executada, minimizando o consumo de energia, a geração de calor e evitando ruídos. O AMD PowerTune visa solucionar restrições de desempenho e potência de projeto térmico.[1]

Além do consumo reduzido de energia, o AMD PowerTune ajuda a diminuir os níveis de ruído criados pelo resfriamento em computadores de mesa e aumenta a vida útil da bateria em dispositivos móveis. AMD PowerTune é o sucessor do AMD PowerPlay.[2]

O suporte para "PowerPlay" foi adicionado ao driver do kernel Linux "amdgpu" em 11 de novembro de 2015.[3]

Como mostra uma palestra do CCC em 2014, o firmware SMU x86-64 da AMD é executado em alguns LatticeMico32 e o PowerTune foi modelado usando Matlab.[4] Isso é semelhante ao PDAEMON da Nvidia, o RTOS responsável pela energia de suas GPUs.[5]

Visão geral

Arquitetura da versão PowerTune, que foi introduzida com chips GCN1.1, como o Bonaire

O AMD PowerTune foi introduzido no TeraScale 3 (VLIW4) com Radeon HD 6900 em 15 de dezembro de 2010 e está disponível em diferentes estágios de desenvolvimento em produtos das marcas Radeon e AMD FirePro desde então.

Ao longo dos anos, análises que documentam o desenvolvimento do AMD PowerTune foram publicadas pela AnandTech.[6][7][8][9]

Uma tecnologia adicional chamada AMD ZeroCore Power está disponível desde a série Radeon HD 7000, implementando a microarquitetura Graphics Core Next.

A inutilidade de uma frequência de relógio fixa foi credenciada em janeiro de 2014 pela SemiAccurate.[10]

Suporte ao sistema operacional

O suporte ao PowerTune está contido no driver de dispositivo do kernel Linux amdgpu.

O AMD Catalyst está disponível para Microsoft Windows e Linux e oferece suporte ao AMD PowerTune.

O driver de dispositivo gráfico "Radeon", gratuito e de código aberto, tem algum suporte para AMD PowerTune, veja "Enduro".[11]

Visão geral dos recursos para APUs AMD

A tabela a seguir mostra recursos das APUs da AMD

Plataforma Alta, padrão e baixa potência Baixa e ultra baixa potência
Nome de código Servidor Basic Toronto
Micro Kyoto
Desktop Performance Renoir Cezanne
Mainstream Llano Trinity Richland Kaveri Kaveri Refresh (Godavari) Carrizo Bristol Ridge Raven Ridge Picasso
Entrada
Basic Kabini
Mobile Performance Renoir Cezanne Rembrandt
Mainstream Llano Trinity Richland Kaveri Carrizo Bristol Ridge Raven Ridge Picasso
Entrada Dalí
Basic Desna, Ontario, Zacate Kabini, Temash Beema, Mullins Carrizo-L Stoney Ridge
Integrado Trinity Bald Eagle Merlin Falcon,
Brown Falcon
Great Horned Owl Grey Hawk Ontario, Zacate Kabini Steppe Eagle, Crowned Eagle,
LX-Family
Prairie Falcon Banded Kestrel
Lançado Agosto de 2011 Outubro de 2012 Junho de 2013 Janeiro de 2014 2015 Junho de 2015 Junho de 2016 Outubro de 2017 Janeiro de 2019 Março de 2020 Janeiro de 2021 Janeiro de 2022 Janeiro de 2011 Maio 2013 Apr 2014 Maio de 2015 Fevereiro de 2016 Abril de 2019
Microarquitetura de CPU K10 Piledriver Steamroller Excavator "Excavator+"[12] Zen Zen+ Zen 2 Zen 3 Zen 3+ Bobcat Jaguar Puma Puma+[13] "Excavator+" Zen
ISA x86-64 x86-64
Socket Desktop High-end
Mainstream AM4
Entrada FM1 FM2 FM2+[nota 1]
Basic AM1
Outros FS1 FS1+, FP2 FP3 FP4 FP5 FP6 FP7 FT1 FT3 FT3b FP4 FP5
Versão PCI Express 2.0 3.0 4.0 2.0 3.0
Fab. (nm) GF 32SHP
(HKMG SOI)
GF 28SHP
(HKMG bulk)
GF 14LPP
(FinFET bulk)
GF 12LP
(FinFET bulk)
TSMC N7
(FinFET bulk)
TSMC N6
(FinFET bulk)
TSMC N40
(bulk)
TSMC N28
(HKMG bulk)
GF 28SHP
(HKMG bulk)
GF 14LPP
(FinFET bulk)
Area do Die (mm2) 228 246 245 245 250 210[14] 156 180 210 75 (+ 28 FCH) 107 ? 125 149
TDP min. (W) 35 17 12 10 15 4.5 4 3.95 10 6
TDP max. de APU (W) 100 95 65 45 18 25
Clock base max. de stock de APU (GHz) 3 3.8 4.1 4.1 3.7 3.8 3.6 3.7 3.8 4.0 3.3 1.75 2.2 2 2.2 3.2 2.6
Máximo de APUs por nó[nota 2] 1 1
Max CPU[nota 3] cores por APU 4 8 2 4 2
Max threads por core de CPU 1 2 1 2
i386, i486, i586, CMOV, NOPL, i686, PAE, NX bit, CMPXCHG16B, AMD-V, RVI, ABM, e LAHF/SAHF de 64-bit Yes Yes
IOMMU[nota 4] Yes
BMI1, AES-NI, CLMUL, e F16C Yes
MOVBE Yes
AVIC, BMI2 e RDRAND Yes
ADX, SHA, RDSEED, SMAP, SMEP, XSAVEC, XSAVES, XRSTORS, CLFLUSHOPT, e CLZERO Yes Yes
WBNOINVD, CLWB, RDPID, RDPRU, e MCOMMIT Yes
FPUs por core 1 0.5 1 1 0.5 1
Tubos por FPU 2 2
Largura do tubo FPU 128-bit 256-bit 80-bit 128-bit
Nível SIMD do conjunto de instruções da CPU SSE4a[nota 5] AVX AVX2 SSSE3 AVX AVX2
3DNow! Yes
FMA4, LWP, TBM, e XOP Yes Yes
FMA3 Yes Yes
Cache L1 de dados por núcleo (KiB) 64 16 32 32
Associatividade do cache de dados L1 (maneiras) 2 4 8 8
Caches de instruções L1 por core 1 0.5 1 1 0.5 1
Cache máximo de instrução L1 total da APU (KiB) 256 128 192 256 64 128 96 128
Associatividade de cache de instrução L1 (maneiras) 2 3 4 8 2 3 4
Caches L2 por core 1 0.5 1 1 0.5 1
Cache L2 total de APU máximo (MiB) 4 2 4 1 2 1
Associatividade de cache L2 (maneiras) 16 8 16 8
Cache L3 total da APU (MiB) 4 8 16 4
Associatividade de cache APU L3 (maneiras) 16 16
Esquema de cache L3 Victim Victim
Suporte max. de DRAM stock DDR3-1866 DDR3-2133 DDR3-2133, DDR4-2400 DDR4-2400 DDR4-2933 DDR4-3200, LPDDR4-4266 DDR5-4800, LPDDR5-6400 DDR3L-1333 DDR3L-1600 DDR3L-1866 DDR3-1866, DDR4-2400 DDR4-2400
Max. de canais DRAM por APU 2 1 2
Max. largura de banda DRAM de stock por APU (GB/s) 29.866 34.132 38.400 46.932 68.256 102.400 10.666 12.800 14.933 19.200 38.400
Microarquitetura GPU TeraScale 2 (VLIW5) TeraScale 3 (VLIW4) GCN 2nd gen GCN 3rd gen GCN 5th gen[15] RDNA 2nd gen TeraScale 2 (VLIW5) GCN 2nd gen GCN 3rd gen[15] GCN 5th gen
Conjunto de instruções da GPU Conjunto de instruções TeraScale Conjunto de instruções GCN Conjunto de instruções RDNA Conjunto de instruções TeraScale Conjunto de instruções GCN
Clock base da GPU de stock máximo (MHz) 600 800 844 866 1108 1250 1400 2100 2400 538 600 ? 847 900 1200
Max stock GPU base GFLOPS[nota 6] 480 614.4 648.1 886.7 1134.5 1760 1971.2 2150.4 3686.4 86 ? ? ? 345.6 460.8
Motor 3D [nota 7] Até 400:20:8 Até 384:24:6 Até 512:32:8 Até 704:44:16[16] Até 512:32:8 768:48:8 80:8:4 128:8:4 Até 192:?:? Até 192:?:?
IOMMUv1 IOMMUv2 IOMMUv1 ? IOMMUv2
Decodificador de vídeo UVD 3.0 UVD 4.2 UVD 6.0 VCN 1.0[17] VCN 2.1[18] VCN 2.2[18] VCN 3.1 UVD 3.0 UVD 4.0 UVD 4.2 UVD 6.0 UVD 6.3]] VCN 1.0
Codificador de vídeo VCE 1.0 VCE 2.0 VCE 3.1 VCE 2.0 VCE 3.1
Movimento Fluido AMD Não Yes Não Não Yes Não
Economia de energia da GPU PowerPlay PowerTune PowerPlay PowerTune[19]
TrueAudio Yes[20] ? Yes
FreeSync 1
2
1
2
HDCP[nota 8] ? 1.4 1.4
2.2
? 1.4 1.4
2.2
PlayReady[nota 9] 3.0 not yet 3.0 ainda não
Telas compatíveis[nota 10] 2–3 2–4 3 3 (desktop)
4 (mobile, integrado)
4 2 3 4
/drm/radeon[nota 11][22][11] Yes Yes
/drm/amdgpu[nota 12][23] Yes[24] Yes[24]
  1. Para modelos Excavator FM2+: A8-7680, A6-7480 e Athlon X4 845.
  2. Um PC seria um nó.
  3. Uma APU combina uma CPU e uma GPU. Ambos têm núcleos.
  4. Requer suporte de firmware
  5. No SSE4. No SSSE3.
  6. O desempenho de precisão simples é calculado a partir da velocidade de clock do núcleo base (ou boost) com base em uma operação FMA.
  7. Shaders unificados : unidades de mapeamento de textura : unidades de saída de renderização
  8. Para reproduzir conteúdo de vídeo protegido, também é necessário suporte a placa, sistema operacional, driver e aplicativo. Um monitor HDCP compatível também é necessário para isso. O HDCP é obrigatório para a saída de certos formatos de áudio, colocando restrições adicionais na configuração multimídia.
  9. Para reproduzir conteúdo de vídeo protegido, também é necessário suporte a placa, sistema operacional, driver e aplicativo. Um monitor HDCP compatível também é necessário para isso. O HDCP é obrigatório para a saída de certos formatos de áudio, colocando restrições adicionais na configuração multimídia.
  10. Para alimentar mais de dois monitores, os painéis adicionais devem ter suporte nativo para DisplayPort.[21] Alternativamente, adaptadores DisplayPort-to-DVI/HDMI/VGA ativos podem ser empregados.
  11. DRM (Direct Rendering Manager) é um componente do kernel Linux. O suporte nesta tabela refere-se à versão mais atual.
  12. DRM (Direct Rendering Manager) é um componente do kernel Linux. O suporte nesta tabela refere-se à versão mais atual.


Visão geral dos recursos para placas de vídeo AMD

A tabela a seguir mostra os recursos das GPUs da AMD / ATI (consulte também: Lista de unidades de processamento gráfico da AMD).

Nome da série de GPUs Wonder Mach 3D Rage Rage Pro Rage 128 R100 R200 R300 R400 R500 R600 RV670 R700 Evergreen Northern
Islands
Southern
Islands
Sea
Islands
Volcanic
Islands
Arctic
Islands
/Polaris
Vega Navi 1x Navi 2x Navi 3x
Lançamento 1986 1991 Abril
1996
Março
1997
Agosto
1998
Abril
2000
Agosto
2001
Setembro
2002
Maio
2004
Outubro
2005
Maio
2007
Novembro
2007
Junho
2008
Setembro
2009
Outubro
2010
Janeiro
2012
Setembro
2013
Junho
2015
Junho 2016, Abril 2017, Agosto 2019 Junho 2017, Fevereiro 2019 Julho
2019
Novembro
2020
Dezembro
2022
Nome de marketing Wonder Mach 3D
Rage
Rage
Pro
Rage
128
Radeon
7000
Radeon
8000
Radeon
9000
Radeon
X700/X800
Radeon
X1000
Radeon
HD 2000
Radeon
HD 3000
Radeon
HD 4000
Radeon
HD 5000
Radeon
HD 6000
Radeon
HD 7000
Radeon
200
Radeon
300
Radeon
400/500/600
Radeon
RX Vega, Radeon VII
Radeon
RX 5000
Radeon
RX 6000
Radeon
RX 7000
Suporte AMD Terminou Atual
Tipo 2D 3D
Conjunto de instruções Não conhecido publicamente Conjunto de instruções TeraScale Conjunto de instruções GCN Conjunto de instruções RDNA
Microarquitetura TeraScale 1
(VLIW)
TeraScale 2
(VLIW5)
TeraScale 2
(VLIW5)

até 68xx
TeraScale 3
(VLIW4)

em 69xx [25][26]
GCN 1st
gen
GCN 2nd
gen
GCN 3rd
gen
GCN 4th
gen
GCN 5th
gen
RDNA RDNA 2 RDNA 3
Tipo Pipieline fixo[a] Pipelies de pixel e vértice programáveis Modelo de shader unificado
Direct3D 5.0 6.0 7.0 8.1 9.0
11 (9_2)
9.0b
11 (9_2)
9.0c
11 (9_3)
10.0
11 (10_0)
10.1
11 (10_1)
11 (11_0) 11 (11_1)
12 (11_1)
11 (12_0)
12 (12_0)
11 (12_1)
12 (12_1)
11 (12_1)
12 (12_2)
Modelo de shader 1.4 2.0+ 2.0b 3.0 4.0 4.1 5.0 5.1 5.1
6.5
6.7 6.7
OpenGL 1.1 1.2 1.3 2.1[b][27] 3.3 4.5 (no Linux: 4.5 (Mesa 3D 21.0))[28][29][30][c] 4.6 (no Linux: 4.6 (Mesa 3D 20.0))
Vulkan 1.0
(Win 7+ ou Mesa 17+)
1.2 (Adrenalin 20.1.2, Linux Mesa 3D 20.0)
1.3 (GCN 4 e superior (com Adrenalin 22.1.2, Mesa 22.0))
1.3
OpenCL Close to Metal 1.1 (sem suporte Mesa 3D) 1.2 (no Linux: 1.1 (sem suporte de imagem) com Mesa 3D) 2.0 (Adrenalin driver no Win7+)
(no Linux: 1.1 (sem suporte de imagem) com Mesa 3D, 2.0 com drivers AMD ou AMD ROCm)
2.0 2.1 [31] ?
HSA / ROCm Yes ?
Decodificação de vídeo ASIC Avivo/UVD UVD+ UVD 2 UVD 2.2 UVD 3 UVD 4 UVD 4.2 UVD 5.0 ou 6.0 UVD 6.3 UVD 7 [32][d] VCN 2.0 [32][d] VCN 3.0 [33] ?
Codificação de vídeo ASIC VCE 1.0 VCE 2.0 VCE 3.0 or 3.1 VCE 3.4 VCE 4.0 [32][d]
Fluid Motion ASIC[e] Não Yes Não ?
Economia de energia ? PowerPlay PowerTune PowerTune & ZeroCore Power ?
TrueAudio Através de DSP dedicado Através de shaders ?
FreeSync 1
2
?
HDCP[f] ? 1.4 2.2 2.3 [34]
PlayReady[f] 3.0 Não 3.0 ?
Exibições suportadas[g] 1–2 2 2–6 ?
Máx. resolução ? 2–6 ×
2560×1600
2–6 ×
4096×2160 @ 30 Hz
2–6 ×
5120×2880 @ 60 Hz
3 ×
7680×4320 @ 60 Hz [35]

7680×4320 @ 60 Hz PowerColor
?
/drm/radeon[h] Yes ?
/drm/amdgpu[h] Não Experimental [36] Yes ?
  1. A série Radeon 100 possui sombreadores de pixel programáveis, mas não é totalmente compatível com DirectX 8 ou Pixel Shader 1.0. Veja o artigo sobre Pixel shaders do R100.
  2. Os cartões baseados em R300, R400 e R500 não são totalmente compatíveis com OpenGL 2+, pois o hardware não oferece suporte a todos os tipos de texturas não-potência de dois (NPOT).
  3. A conformidade com OpenGL 4+ requer suporte a shaders FP64 e estes são emulados em alguns chips TeraScale usando hardware de 32 bits.
  4. a b c O UVD e o VCE foram substituídos pelo Video Core Next (VCN) ASIC na APU Raven Ridge do Vega.
  5. Processamento de vídeo ASIC para técnica de interpolação de taxa de quadros de vídeo. No Windows funciona como um filtro DirectShow no seu player. No Linux, não há suporte por parte dos drivers e/ou da comunidade.
  6. a b Para reproduzir conteúdo de vídeo protegido, também é necessário suporte a cartão, sistema operacional, driver e aplicativo. Um monitor HDCP compatível também é necessário para isso. O HDCP é obrigatório para a saída de certos formatos de áudio, colocando restrições adicionais na configuração de multimídia.
  7. Mais monitores podem ser suportados com conexões DisplayPort nativas ou dividindo a resolução máxima entre vários monitores com conversores ativos.
  8. a b DRM (Direct Rendering Manager) é um componente do kernel do Linux. AMDgpu é o módulo do kernel do Linux. O suporte nesta tabela refere-se à versão mais atual.

Ver também

Notas

Referências

  1. «AMD PowerTune Technology» (PDF). AMD. 23 de março de 2012. Consultado em 29 de abril de 2025. Cópia arquivada (PDF) em 1 de março de 2015 
  2. «AMD PowerTune vs PowerPlay» (PDF). AMD. 1 de dezembro de 2010. Consultado em 29 de abril de 2025. Arquivado do original (PDF) em 14 de julho de 2014 
  3. «Add amdgpu powerplay support». 11 de novembro de 2015. Consultado em 29 de abril de 2025 
  4. «AMD x86 SMU firmware analysis». 27 de dezembro de 2014. Consultado em 29 de abril de 2025 
  5. «Reverse engineering power management on Nvidia GPUs» (PDF) 
  6. «Redefining TDP With PowerTune». AnandTech. 15 de dezembro de 2010 
  7. «Introducing PowerTune Technology With Boost». AnandTech. 22 de junho de 2012 
  8. «The New PowerTune: Adding Further States». AnandTech. 22 de março de 2013 
  9. «PowerTune: Improved Flexibility & Fan Speed Throttling». AnandTech. 23 de outubro de 2014 
  10. «What is AMD's PowerTune 2.0 and what does it do?». SemiAccurate. 16 de dezembro de 2013 
  11. a b «Radeon feature matrix». freedesktop.org. Consultado em 19 de setembro de 2022 
  12. «AMD Announces the 7th Generation APU: Excavator mk2 in Bristol Ridge and Stoney Ridge for Notebooks». 31 de maio de 2016. Consultado em 17 de setembro de 2022 
  13. «AMD Mobile "Carrizo" Family of APUs Designed to Deliver Significant Leap in Performance, Energy Efficiency in 2015» (Nota de imprensa). 20 de novembro de 2014. Consultado em 17 de setembro de 2022. Cópia arquivada em 10 de fevereiro de 2015 
  14. «The Mobile CPU Comparison Guide Rev. 13.0 Page 5 : AMD Mobile CPU Full List». TechARP.com. Consultado em 17 de setembro de 2022 
  15. a b «AMD VEGA10 and VEGA11 GPUs spotted in OpenCL driver». VideoCardz.com. Consultado em 17 de setembro de 2022 
  16. Cutress, Ian (1 de fevereiro de 2018). «Zen Cores and Vega: Ryzen APUs for AM4 – AMD Tech Day at CES: 2018 Roadmap Revealed, with Ryzen APUs, Zen+ on 12nm, Vega on 7nm». Anandtech. Consultado em 17 de setembro de 2022 
  17. Larabel, Michael (17 de novembro de 2017). «Radeon VCN Encode Support Lands in Mesa 17.4 Git». Phoronix. Consultado em 19 de setembro de 2022 
  18. a b «AMD Ryzen 5000G 'Cezanne' APU Gets First High-Res Die Shots, 10.7 Billion Transistors In A 180mm2 Package». wccftech. 12 de agosto de 2021. Consultado em 19 de setembro de 2022 
  19. Tony Chen; Jason Greaves, «AMD's Graphics Core Next (GCN) Architecture» (PDF), AMD, consultado em 19 de setembro de 2022 
  20. «A technical look at AMD's Kaveri architecture». Semi Accurate. Consultado em 19 de setembro de 2022 
  21. «How do I connect three or More Monitors to an AMD Radeon™ HD 5000, HD 6000, and HD 7000 Series Graphics Card?». AMD. Consultado em 19 de setembro de 2022. Cópia arquivada em 11 de dezembro de 2014 
  22. Airlie, David (26 de novembro de 2009). «DisplayPort supported by KMS driver mainlined into Linux kernel 2.6.33». Consultado em 19 de setembro de 2022 
  23. Deucher, Alexander (16 de setembro de 2015). «XDC2015: AMDGPU» (PDF). Consultado em 19 de setembro de 2022 
  24. a b Michel Dänzer (17 de novembro de 2016). «[ANNOUNCE] xf86-video-amdgpu 1.2.0». lists.x.org 
  25. «AMD Radeon HD 6900 (AMD Cayman) series graphics cards». HWlab. hw-lab.com. 19 de dezembro de 2010. Consultado em 22 de abril de 2023. Cópia arquivada em 23 de agosto de 2022. New VLIW4 architecture of stream processors allowed to save area of each SIMD by 10%, while performing the same compared to previous VLIW5 architecture 
  26. «GPU Specs Database». TechPowerUp. Consultado em 22 de abril de 2023 
  27. «NPOT Texture (OpenGL Wiki)». Khronos Group (em inglês). Consultado em 22 de abril de 2023 
  28. «AMD Radeon Software Crimson Edition Beta». AMD. Consultado em 22 de abril de 2023 
  29. «Mesamatrix». mesamatrix.net. Consultado em 22 de abril de 2023 
  30. «RadeonFeature». X.Org Foundation. Consultado em 22 de abril de 2023 
  31. «AMD Radeon RX 6800 XT Specs». TechPowerUp. Consultado em 22 de abril de 2023 
  32. a b c Killian, Zak (22 de março de 2017). «AMD publishes patches for Vega support on Linux». Tech Report. Consultado em 22 de abril de 2023 
  33. Larabel, Michael (15 de setembro de 2020). «AMD Radeon Navi 2 / VCN 3.0 Supports AV1 Video Decoding». Phoronix. Consultado em 22 de abril de 2023 
  34. Edmonds, Rich (4 de fevereiro de 2022). «ASUS Dual RX 6600 GPU review: Rock-solid 1080p gaming with impressive thermals». Windows Central (em inglês). Consultado em 22 de abril de 2023 
  35. «Radeon's next-generation Vega architecture» (PDF). Radeon Technologies Group (AMD). Consultado em 22 de abril de 2023. Arquivado do original (PDF) em 6 de setembro de 2018 
  36. Larabel, Michael (7 de dezembro de 2016). «The Best Features of the Linux 4.9 Kernel». Phoronix. Consultado em 22 de abril de 2023 

Ligações externas