Hele, Nehalem!

20. listopad 2008

Společnost Intel představila procesor Core i7 s architekturou Nehalem. Tvrdí o něm, že je to největší inovace v řadě od roku 1995, kdy uvedla procesor Pentium Pro. Co je to za novinku?

Začněme pěkně od začátku. Nehalem je kódové jméno pro mikroarchitekturu. A těch jsme od Intelu zažili celou řadu, například P6 (Pentium Pro až Pentium III) nebo s názvem NetBurst (Pentium 4, Pentium D). Nehalem se na rozdíl od předchůdců chová k procesoru jako ke skládačce. Konstruktér procesoru si tak může vzít několik jader procesoru a zkombinovat je s dalšími stavebními kameny, jako je cache L3 (rychlá vyrovnávací paměť 3. úrovně), paměťové rozhraní (RAM interface) nebo rozhraní pro komunikaci s okolím procesoru (QPI).

Co je to jádro procesoru?

Od roku 1971 do roku 1999 jsme znali procesor jako součástku, která se vejde na jeden elektronický čip. My ale nevidíme čip, vidíme jeho pouzdro, ať je keramické, nebo z jiných materiálů. Z původních tisíců tranzistorů se staly desítky a desítky milionů, ale stále se jednalo o čip, na který se vejde právě jediný procesor. Roku 1999 se poprvé podařilo umístit na jediný čip dva procesory. Problém je v tom, že jsme si až příliš zvykli říkat všemu v jednom pouzdru procesor. Ale jak označovat cosi, kde jsou procesory dva? Dvouprocesorový procesor? To vypadá velmi podivně. Proto se slovo "procesor" zaměnilo za "jádro". Výsledek tedy označujeme "dvoujádrový procesor". Jestliže se do jediného pouzdra vejdou čtyři procesory, říká se celku "čtyřjádrový procesor".

Čtyři jádra

Pusťme se do procesoru Core i7. Každé ze čtyř jader má k dispozici vlastní cache L1 (32 + 32 KiB) a L2 (256 KiB). Zatímco první cache slouží k udržení maximálního výkonu procesoru, další cache slouží k udržení co největšího množství informací poblíž procesoru. Cache má také letité označení "rychlá vyrovnávací paměť"; obsahuje kopie informací naposledy použitých procesorem. Každé jádro umí Hyper-Threading tedy předstírá, že je přítomen dvakrát, což některé programy potřebují. Když jsou jádra čtyři, každé předstírá, že je dvakrát, vytváří Core i7 dojem osmijádrového procesoru. Všechna čtyři jádra mají dohromady cache L3 s kapacitou 8 MiB. Ta slouží jako společné skladiště naposledy použitých informací pro všechna jádra. To zlepšuje jejich vzájemnou spolupráci, případně společnou práci na jednom velkém bloku dat.

Čtyřjádrový procesor Core i7, v němž byla poprvé použita architektura Nehalem.

Hyper... co?

Hyper-Threading je způsob, jak získat z procesoru maximum. Procesor lze přirovnat k dílně, program k dělníkovi. Čím je procesor lepší, tím více výkonných jednotek má (podobně jako lepší dílna má třeba vedle svěráku také brusku). A to je právě problém - jestliže v dílně bude jediný dělník, může najednou pracovat jen na jednom stroji. Nemá tedy smysl přidávat další a další stroje, protože to jeho výkon nezvýší. Podobně se do procesoru již nepřidávají další výkonné části, protože to výkon procesoru stejně nezvýší. Proto se místo jediného dělníka vpustí do dílny dva. Počet strojů je sice stejný, ale najednou mohou pracovat dva lidé, a tak se výkon dílny může až zdvojnásobit. Podobně se u procesoru vytvoří dva kanály pro vstup příkazů, i když počet výkonných jednotek je stále stejný. Problém nastane, jestliže oba dělníci potřebují totéž (například svěrák). Pak musí jeden z nich počkat a výkon dílny opět klesá na výkon jediného pracovníka. Dokonce se může výkon i mírně snížit, pokud se budou o sdílený svěrák dohadovat.

Svižná paměť

Procesor Core i7 má vlastní řadič paměti. Řečeno jinak paměť RAM se připojuje přímo k procesoru, nepoužívá k tomu čipset. Procesor má dokonce tři řadiče, a tak disponuje třemi 64bitovými paměťovými kanály. Každý kanál umožňuje osadit maximálně dva moduly. Díky tomu lze připojit až 6 modulů. Doposud měly známé procesory k dispozici jen dva kanály, a tak se teoreticky zvyšuje přenosová rychlost o 50 % (měřeno pouze počtem kanálů). Mezi RAM pamětí a procesorem ale není žádná část, která by tuto komunikaci brzdila, a tak se ve skutečnosti data přenášejí ještě rychleji. Paměťové moduly se ideálně osazují po trojicích, což je další novinka, na kterou si musíme zvyknout. Moduly se tak nebudou párovat, ale spíš ztrojovat. Podle vyjádření výrobce si ale procesor poradí i s menším množstvím modulů, případně i s rozličnou kombinací kapacit. Procesory umějí zaručeně paměti typu DDR3 SDRAM, a to na frekvencích 800 nebo 1067 MHz.

Právě díky trojicím modulů si musíme zvyknout na nová čísla kapacit RAM. Tradičně se používaly mocniny dvou (1, 2, 4, 8, 16...). To fungovalo i ve chvíli, když jsme místo jediného kanálu měli dva. Tři kanály ale počítají logicky po třech, a tak 3x 1 GiB = 3 GiB RAM, trojice modulů 2 GiB dává 6 GiB RAM, třikrát 4 GiB dá 12 GiB. Pokud se osadí obě trojice, násobí se uvedené kapacity dvěma. A tak maximální kapacita RAM paměti u procesoru Core i7 činí 4*3*2 = 24 GiB RAM.

Jedno pouzdro už dávno neznamená jeden procesor.

Trojice RAM modulů může vytvořit jednu zajímavost. Pro mnohé operační systémy je velmi výhodné mít 3 GiB RAM. To se ale běžnými metodami dosahuje ne zrovna nejlépe. Pokud ale můžeme mít RAM moduly po třech, je to jednoduché, zvládá to každé malé dítě: 3 x 1 = 3. Třikrát modul 1 GiB dá právě oněch požadovaných 3 GiB RAM.

Komunikace

Procesor komunikuje se svým okolím přes sběrnici QPI neboli QuickPath Interconnect. To je velmi moderní způsob přenosu dat typu point-to-point, kdy každý směr má vlastní kanál (zjednodušeně řečeno). To lze přirovnat k silnici, kdy každým směrem vede samostatný pruh (a uprostřed dvojitá plná čára a betonová zábrana). Díky tomu není nutné přerušit komunikaci, jestliže je zapotřebí přenést nějaká data opačným směrem. Navíc se přenosová rychlost oproti předchozímu řešení (FSB) výrazně zvýšila. Přenosovou rychlost obvykle měříme v množství informací za jednotku času, například v GB/s. Zde se ale objevilo označení GT/s (giga transfer). Je to pomocný údaj, který zde měří počet přenosů za sekundu. Protože se jedná o přenos 16 bitů jedním směrem, dá se říci, že GT/s * 2 = GB/s. Jestliže je u procesorů Intel Core i7 přenosová rychlost 4,8 GT/s, dosahuje 9,6 GB/s jedním směrem. Pokud se oba směry sečtou, dostaneme 19,2 GB/s. Nejvýkonnější varianta procesoru "Intel Core i7 Extreme Edition" používá přenosovou rychlost 6,4 GT/s, což dává maximální přenosovou rychlost až 25,6 GB/s!

(Zase) nová patice

Všechna zlepšení si vyžádala malou daň v podobě nové patice pro procesor. Místo dosavadní LGA775 si musíme zvyknout na LGA1366. Číslo vyjadřuje počet pozlacených plošek zespodu procesoru. Nová patice vyžaduje novou základní desku. Nepočítejte proto s možností, že si svůj počítač vylepšíte tím, že starý procesor zahodíte a koupíte si Core i7. Až tak jednoduché to není. Na druhou stranu nová patice tu s námi bude nejméně tři roky.

Nová patice má 1366 kontaktů.

Procesor Intel Core i7 míří do výkonnějších až nejvýkonnějších počítačů s jediným procesorem. Může to být herní počítač, pracovní stanice, ale také server. To vše se již v den předvedení procesoru objevilo.


Autor je ředitelem Muzea počítačů.

autor: Patrik Veselík
Spustit audio