Código da língua portuguesa segundo a ISO 639-1.Código da língua inglesa segundo a ISO 639-1.
ISO 639 é formado por "Códigos para a representação de nomes de línguas" (do inglês: "Codes for the representation of names of languages"); é uma norma técnica padrão da "Organização Internacional para Padronização", que instituiu códigos que representam cada língua (idiomas) do planeta. É aplicada em áreas como linguística, lexicografia, terminologia e bibliografia. Na Internet, por exemplo, é usada para indicar a língua em que se encontra um documento html (website) ou um trecho do mesmo - o código da língua portuguesa, por exemplo, é pt; o do inglês, en.
ISO 639-1:2002
A Parte 1: o código alfa-2, é composta por códigos de duas letras, criada para codificar apenas as línguas principais do mundo, para quais foram criadas terminologias especializadas. Em geral, mas não necessariamente, constitui uma abreviação do nome da língua em inglês; todos os códigos representam línguas individuais (um idioma único), nunca coletivos.
O uso da parte 1 foi encorajado pela RFC 1766 e a seguir pela RFC 3066, que informa que o código de duas letras deve ser usado preferencialmente, usado sempre quando disponível. A RFC 3066 recomenda ainda que não sejam criados novos códigos para línguas já contempladas pela ISO 639-2, de forma que as atualizações são pouco frequentes. A autoridade responsável pela atualização dos códigos ISO 639-1 é o "International Centre of Terminology" (Infoterm), mas a divulgação é feita em conjunto com o padrão ISO 639-2.
ISO 639-2:1998
A Parte 2: código alfa-3, é composta de códigos de três letras, criada para uso em terminologia e também para uso na documentação bibliográfica. Designa códigos para todas as línguas codificadas na ISO 639-1 e "muitas outras línguas que contam com corpos de literatura significativos"; também especifica códigos para grupos linguísticos, "cobrindo indiretamente quase todas as línguas do mundo"; por fim, existem códigos para língua indeterminada (und), para múltiplas línguas (mul), e as de uso regional (qaa-qtz). Só discrimina variações linguísticas que possam ser caracterizadas pela forma escrita, como por exemplo o cantonês e o mandarim são ambos codificados com zho/chi (chinês).
Existem 22 línguas, incluindo o chinês, para as quais existe um par de códigos de três letras. O primeiro código, denominado ISO 639-2/B, foi derivado dos códigos de língua usados no MARC 21, um projeto de informatização de catálogos bibliográficos. No caso dessas duas 22 línguas, o código diferia significativamente daquele especificado na ISO 639-1, sendo então criados códigos ISO 639-2/T (de terminologia). Para evitar confusão, um código "B" não pode ser reaproveitado como "T" ou vice-versa. Todas as línguas com mais de um código ISO 639-2 têm, necessariamente, um código ISO 639-1.
A ISO 639-2 é recomendada na RFC 3066, para quando não houver código ISO 639-1 disponível. A atualização do código é responsabilidade da Biblioteca do Congresso dos Estados Unidos.
Outras partes
As seguintes partes ainda estão em fase de rascunho:
ISO 639-3 (Alpha-3 code for comprehensive coverage of languages) — código de três letras abrangendo "macrolínguas" (como o chinês) e línguas individuais (como o português), mas não coletivos (como o nahuatl); em desenvolvimento pela SIL International ("Summer Institute of Linguistics"), com informações provenientes tanto do Ethnologue (publicado pela própria SIL International) quanto do Linguist List.
ISO 639-4 (Implementation guidelines and general principles for language coding) — "Normas de implementação e princípios gerais de codificação de línguas".
ISO 639-5 (Alpha-3 code for language families and groups) — "Código alfa-3 para famílias e grupos de línguas".
ISO 639-6 (Alpha-4 representation for comprehensive coverage of language variation) — "Representação alfa-4 para cobertura abrangente de variação linguística".
Código das línguas
A
ISO 639-2
ISO 639-1
Nome em inglês
Nome em português
Nome nativo
aar
aa
Afar
afar
afar
abk
ab
Abkhazian
abcázio
Аҧсуа
ace
Achinese
achém; achinês
ach
Acoli
acholi; acoli
ada
Adangme
Dangbe
adangbɛ
ady
Adyghe; Adygei
adigue; adigei
адыгэбзэ; адыгабзэ
afa
Afro-Asiatic languages
Línguas afro-asiáticas
afh
Afrihili
afrihili
afr
af
Afrikaans
africânder
Afrikaans
ain
Ainu (Japan)
aino
アイヌ
aka
ak
Acã
Acã
akana
akk
Akkadian
acádio
akkadû; lišānum akkadītum
ale
Aleut
aleúte
Unangax tunuu
alg
Algonquian languages
Línguas algonquinas
alt
Southern Altai
altai do sul
amh
am
Amharic
amárico
አማርኛ
ang
English, Old (ca.450-1100)
inglês antigo (ca. 450-1100)
Englisc
anp
Angika
apa
Apache languages
Línguas apache
Ndéé
ara
ar
Arabic
árabe
العربية
arc
Aramaic
aramaico
ܐܪܡܝܐ
arg
an
Aragonese
aragonês
aragonés
arn
Mapudungun; Mapuche
mapudungun; mapuche
arp
Arapaho
arapaho
Hinono'eitiit
art
Artificial languages
Línguas artificiais
arw
Arawak
aruaque
asm
as
Assamese
assamês
অসমীয়া
ast
Asturian; Bable
asturiano; bable
asturianu
ath
Athapascan languages
Línguas atabascanas
aus
Australian languages
Línguas australianas
ava
av
Avaric
avárico
авар
ave
ae
Avestan
avéstico
avesta
awa
Awadhi
awadhi
आवधी
aym
ay
Aymara
aimará
aymar
aze
az
Azerbaijani
azerbaijano
Azərbaycan
B
ISO 639-2
ISO 639-1
Nome em inglês
Nome em português
Nome nativo
bad
Banda
banda
bai
Bamileke languages
Línguas bamileke
bak
ba
Bashkir
basquir
Башҡорт
bal
Baluchi
balúchi
بلوچی
bam
bm
Bambara
bâmbara
bamanankan
ban
Balinese
balinês
basa Bali
bas
Basa (Cameroon)
basa
ɓasaá
bat
Baltic languages
Línguas bálticas
bej
Beja
beja
بداوية
bel
be
Belarusian
bielorrusso
беларуская
bem
Bemba (Zambia)
bemba
ichibemba
ben
bn
Bengali
bengali ou bangla
বাংলা
ber
Berber languages
Línguas berberes
bho
Bhojpuri
boiapuri
भोजपुरी
bih
bh
Bihari Languages
Línguas biaris
भोजपुरी
bik
Bikol
bikol
Bicol
bin
Bini
bini
Èdó
bis
bi
Bislama
bislamá bichlamar
Bislama
bla
Siksika
siksika; blackfoot
ᓱᖽᐧᖿ
bnt
Bantu languages
línguas bantas
bod/tib
bo
Tibetan
tibetano
བོད་ཡིག
bos
bs
Bosnian
bósnio
bosanski
bra
Braj
braj
bre
br
Breton
bretão
brezhoneg
btk
Batak languages (Indonésia)
Línguas bataque (Indonesia)
bua
Buriat
buriat
буряад
bug
Buginese
buginês
ᨅᨔ ᨕᨘᨁᨗ
bul
bg
Bulgarian
búlgaro
български
byn
Blin; Bilin
blin; bilin
ብሊን
C
ISO 639-2
ISO 639-1
Nome em inglês
Nome em português
Nome nativo
cad
Caddo
caddo
Hasí:nay
cai
Central American Indian (Other)
Outras línguas indígenas da América Central
caq
Car Nicobarese
car nicobarês
car
Carib
caribe
cat
ca
Catalan
catalão
català
cau
Caucasian (Other)
cáucaso (Outras)
ceb
Cebuano
cebuano
Sinugboanon
cel
Celtic (Other)
céltico (Outras)
ces/cze
cs
Czech
tcheco
česky
cha
ch
Chamorro
chamorro
chamoru
chb
Chibcha
chibcha
che
ce
Chechen
tchecheno ou checheno
нохчийн
chg
Chagatai
chagatai
جغتای
chk
Chuukese
chuukês; truquês
chm
Mari (Russia)
mari
марий
chn
Chinook jargon
jargão chinook
chinuk wawa
cho
Choctaw
choctaw
Chahta Anumpa
chp
Chipewyan
chipewyan
ᑌᓀᓲᒢᕄᓀ
chr
Cherokee
cherokee
ᏣᎳᎩ
chu
cu
Church Slavic
eslavo eclesiástico; eslavo antigo; búlgaro antigo