Gå til innhold

AMD64 konkurrerer med Itanium


Anbefalte innlegg

Videoannonse
Annonse

Ja, at AMD64 er en direkte konkurrent til Itanium (aka IA64) har vært opplagt lenge. Spesielt for utviklere som har investert mye i x86-arkitekturen, altså hele PC-bransjen, så er AMD64 (aka x86-64) helt klart å foretrekke fremfor IA64 som representerer noe helt nytt og fullstendig ukompatibelt. Takket være AMD64 som utvider x86 til 64-bits så tror jeg PC'en vil leve i mange år til, og dem som tidligere spådde PC'ens snarlige død ser heldigvis ut til å ha tatt grundig feil :p

Lenke til kommentar

Sannt nok. PC'en vil vel leve lenge, men produksjonspris/ytelse vil favorisere IA64 innen kort tid. Deerfield har allerede mindre die size enn AMD64. Total ytelse favoriserer IA64 allerede i dag og trenden ser ut til å fortsette. Minnehåndtering vil favorisere IA64 i framtiden, siden den ikke er særlig følsom for latency, men krever båndbredde som er enkelt å øke. Redusering av minne latency er en problematikk som støter på grunnleggende fysiske begrensninger. x86 kan løse latency problemer med SMT/dualcore teknikker, men da blir produksjonspris/ytelse værre igjen sammenlignet med IA64. x86-64 software er forøvrig ikke mindre sær enn IA64 software. Den prinsippielle forskjellen på AMD64 og IA64 er at AMD64 er god på 32bit software og dårlig på 64bit, mens IA64 er god på 64bit og dårlig på 32 bit. I realiteten er det pr i dag store prisforskjeller og store implementasjons forskjeller. f.eks er Opteron like lite konkurrent til IA64 i 8-way og oppover som den er til Power4 (Selv om jeg regner med mange her nekter å innse det)

Lenke til kommentar

Hovedgrunnen til at Deerfield har mindre kjernestørrelse er utelukkende pga. kraftig redusert cache-størrelse på bare 1.5MB. Da Itanium sin ytelse er veldig følsom for størrelsen på cache så vil nok Deefield yte veldig dårlig også sammenlignet med Opteron dessverre. Deerfield vil derfor neppe bli markedsført som noe annet enn for 'rimelige' arbeidsstasjoner og bladtjenere.

 

AMD har allerede løst forsinkelse-problemer på sine AMD64-prosessorer som alle har integrert minnekontroller som reduserer minneforsinkelsene ('memory latency') betraktelig. Faktisk så har Athlon 64 den laveste minneforsinkelsen som er målt for noen x86-prosessor, på 45ns. SMT/HyperThreading senker ikke forsinkelsene, de øker bare effektiviteten til cache....

 

Itanium har samme begrensningene som dagens FSB-arktitekturer med minnekontrolleren(e) på brikkesettet, noe som utvilsomt representerer en flaskehals sammenlignet med AMDs HyperTransport-arktitektur som alle AMD64-prosessorer har.

 

AMD64 dårlig på 64-bit? Hva er det for noe sprøyt? Jeg bruker selv både 32-bits og 64-bits programmer på AMD64, og det fungerer helt utmerket. Det at Itanium yter dårlig på 32-bits programmer er en 'understatement', elendig ville være en mer passende betegnelse.

 

Itanium baserer seg på en vesentlig mer kostbar arkitektur enn AMD64, som baserer seg på dagens rimelige PC-plattform som gjør den ekstremt konkurransedyktig. Fremtiden vil vise seg hvor bra Opteron skalerer, 4-veis systemer er allerede på vei og 8-veis systemer kommer i løpet av året. Tester så langt har vist at Opteron skalerer bedre enn Itanium, og det er lite som tyder på at det ikke vil fortsette i fremtiden også.

Lenke til kommentar

Ok du om det. AMD's "løsning" på latency er ikke en løsning men en såkalt one-timer utsettelse av problemet. Det er bare et spørsmål om tid før problemet melder seg igjen. SMT/dualcore løser problemet fremfor å utsette det, da en ikke forsøker å forbedre latency, som i utgangspunktet er et tapt slag, men heller omgår problemet ved å gjøre cpu mindre følsom for latency.

 

Ser forøvrig ut som om 2005 kan bli året da IA64 parkerer x86 ytelsesmessig. Med mindre Madison9M drar på 2GHZ, da blir 2004 det magiske året ;)

Lenke til kommentar
Hva mener du med at AMD64 er dårlig på 64 bit og god på 32 bit knickknak?

OK bare for å oppklare. AMD64 vil selvsagt yte bedre på 64 bit enn på 32 bit, men i forhold til andre 64 bit løsninger på markedet så er AMD64 å betegne som en lettvekter. En god pris/ytense kandidat enn så lenge i 4-way og nedover, men ingen kandidat til ytelsestronen i noen N-way systemer. Kan kanskje hevde seg i 4-way på enkelte apps.

Lenke til kommentar
Hva mener du med at AMD64 er dårlig på 64 bit og god på 32 bit knickknak?

OK bare for å oppklare. AMD64 vil selvsagt yte bedre på 64 bit enn på 32 bit, men i forhold til andre 64 bit løsninger på markedet så er AMD64 å betegne som en lettvekter. En god pris/ytense kandidat enn så lenge i 4-way og nedover, men ingen kandidat til ytelsestronen i noen N-way systemer. Kan kanskje hevde seg i 4-way på enkelte apps.

Så vidt jeg veit, så skalerer Opteron betydelig bedre enn Itanium ... så ledelsen Itanium har i ytelse i single forsvinner etterhvert som man legger til CPUer. 4-way Opteron yter likebra om ikke bedre enn 4-way Itanium. Spennende å se med 8-way Opteron.

 

Dessuten; lengere oppe i tråden sa du noe om at Itanium leder forran Opteron på minnebåndbredde... Mens Itanium får stadig dårligere båndbredde per CPU, vil AMDs Opteron bare øke minnebåndbredden for hver CPU (forutsatt at man bruker et OS med NUMA-støtte). 8x 6,4GB/s (Opteron med DDR400)blir et ganske stort tall ;)

Lenke til kommentar
AMD's "løsning" på latency er ikke en løsning men en såkalt one-timer utsettelse av problemet. Det er bare et spørsmål om tid før problemet melder seg igjen.

 

Ser forøvrig ut som om 2005 kan bli året da IA64 parkerer x86 ytelsesmessig. Med mindre Madison9M drar på 2GHZ, da blir 2004 det magiske året ;)

Dette må du forklare litt bedre for dette skjønte jeg ikke.

 

Faktum er at ettersom AMD får opp MHz enda mer på A64 og Opteron REDUSERES latency. Altså blir latency lavere og lavere ettersom MHz går opp. Det høres for min del ut som en glimrende løsning på et stort problem. Hvorfor er det noe feil med det???

 

P4, XEON og Itanium har motsatte effekt. Altså at latency øker med MHz (grunnet mer forskjell mellom minnekontroller og CPU-ens GHz). Skjønner ikke hvorfor mer latency er bedre...

 

Dualcore kommer både AMD og Intel med, men det vil nok først og frems være for server i de første årene.

 

En Madison med 9MB L3 cache vil sikkert yte bra på enkelte applikasjoner, men du må huske på at produksjonskostnaden vil ligge på MANGE ganger mer enn P4 og A64. I tillegg til at det nesten ikke er programvare for IA64... I tillegg er faktisk P4 og A64 forholdsvis raske. Når vi tenker på at de kommer til å yte lange bedre fremover ser jeg ikke noe stort argument for at massene vli "løpe til IA64".

 

Husk at det ikke nødvendigvis er den beste standarden som vinner, men en som er bra nok (jmf. VHS vs BETA).

Lenke til kommentar
Ok du om det. AMD's "løsning" på latency er ikke en løsning men en såkalt one-timer utsettelse av problemet. Det er bare et spørsmål om tid før problemet melder seg igjen. SMT/dualcore løser problemet fremfor å utsette det, da en ikke forsøker å forbedre latency, som i utgangspunktet er et tapt slag, men heller omgår problemet ved å gjøre cpu mindre følsom for latency.

Jeg er ikke enig. AMD64-prosessorene har jo vist seg å skalere utrolig bra så langt, og minneforsinkelsene har gått ned desto høyere klokket prosessorene er blitt. Intel sine prosessorer skalerer langt ifra like bra og har en vesentlig høyere minneforsinkelser pga. sin FSB-arkitektur med minnekontrolleren(e) som en del av brikkesettet. Til forskjell fra AMD så prøver Intel å redusere minneforsinkelsene med å øke cachestørrelsen, som på P4 EE og Itanium. Hadde det ikke vært for disse minneforsinkelsene så hadde det heller ikke vært noe poeng med SMT/HyperThreading. Med overgang til DDR2 så øker jo minneforsinkelsene ytterligere, så en økning av cache og forbedring i SMT/HyperThreading (les: SSE3) blir derfor en nødvendighet...

 

Ser forøvrig ut som om 2005 kan bli året da IA64 parkerer x86 ytelsesmessig. Med mindre Madison9M drar på 2GHZ,  da blir 2004 det magiske året  ;)

Jeg ser ingen indikatorer på det vil skje, eller drømmer du bare nå? Den som lever får se, jeg sier bare Red Storm.... ;)

Endret av snorreh
Lenke til kommentar
Faktum er at ettersom AMD får opp MHz enda mer på A64 og Opteron REDUSERES latency.
Riktig, men det er ikke hele bildet. Latency introdusert av minnebuss protokollen og minnebrikkene blir uforandret. Denne vil etter hvert som cpu hastighet økes medføre en like stor idle % av cpu sykluser som var tilfellet da minnekontrolleren var på northside.

 

Det høres for min del ut som en glimrende løsning på et stort problem. Hvorfor er det noe feil med det???
Det ER en glimrende løsning på et stort problem, men løsningen er ikke endelig. En utsetter bare problemet. I tillegg introduserer intern minnekontroller en del ulemper som gjør det vanskeligere å integrere N-way systemer, N>4 i dette tilfellet.

 

P4, XEON og Itanium har motsatte effekt. Altså at latency øker med MHz (grunnet mer forskjell mellom minnekontroller og CPU-ens GHz). Skjønner ikke hvorfor mer latency er bedre...
Litt pirk først. Latency øker ikke. CPU idle sykluser øker med økt multiplier. Viktig prinsippiell forskjell der. Latency vil også synke for disse systemene ettersom FSB hastighet økes. Særlig vil den latency som oppstår i northside chipset reduseres med økt FSB frekvens.

 

En Madison med 9MB L3 cache vil sikkert yte bra på enkelte applikasjoner, men du må huske på at produksjonskostnaden vil ligge på MANGE ganger mer enn P4 og A64.
Sannt nok, men HW kostnader utgjør uansett svært lite av de totale kostnadene i systemer hvor Madison9M er aktuell. En må bare innse at IA64 ikke har klart å gi god pris/ytelse i workstation segmentet, men det er da heller ikke så rart at en og samme core ikke kan hevde seg i alle segmenter. Samme problemet har AMD64 bare andre veien. IBM Power har vært tilgjengelig på to vidt forskjellige implementasjoner en god stund nå og det er all grunn til å tro at AMD64 og IA64 få samme skjebne.

 

Husk at det ikke nødvendigvis er den beste standarden som vinner, men en som er bra nok (jmf. VHS vs BETA).
Jeg har vært inne på denne tanken mange ganger selv, men er kommet til at dette neppe blir skjebnen til EPIC. fordi: 1) Intel klarte å gjøre x86 til standarden over alle standarder. Det bør de klare med EPIC også. Det blir et langt vanskeligere slag, men så er slagkraften til Intel også blitt større. 2) EPIC vil slå alt som kryper og går av ISA er i dag på produksjonskostnad/ytelse innen 65nm er et faktum. Det er en spekulasjon, men jeg ser i allefall den trenden helt klart.

 

snorreh: red storm. Er vel nærmest som off topic å regne. Klart 16K prosessorer blir spektakulært, men hadde de brukt 16K Madison9M prosessorer så hadde det ikke sett ille ut heller... do the math.

Lenke til kommentar
Faktum er at ettersom AMD får opp MHz enda mer på A64 og Opteron REDUSERES latency.

 

Riktig, men det er ikke hele bildet. Latency introdusert av minnebuss protokollen og minnebrikkene blir uforandret. Denne vil etter hvert som cpu hastighet økes medføre en like stor idle % av cpu sykluser som var tilfellet da minnekontrolleren var på northside.

 

I og for seg enig med deg her. Husk dog på at Athlon 64 sin latency fortsatt vil reduseres ettersom MHz går oppover. Videre vil minnebåndbredde øke for hver ekstra CPU (gitt skikkelig chipsett/implementasjon) på Athlon64/Opteron. Itanium derimot deler båndbredden. En ekstra CPU på Itanium fører til langt mer "problemer" enn for en ektra Opteron, ettersom Opteron ikke må dele på båndbredden.

 

Det høres for min del ut som en glimrende løsning på et stort problem. Hvorfor er det noe feil med det???
Det ER en glimrende løsning på et stort problem, men løsningen er ikke endelig. En utsetter bare problemet. I tillegg introduserer intern minnekontroller en del ulemper som gjør det vanskeligere å integrere N-way systemer, N>4 i dette tilfellet.

 

Å utsette problemer er vel alt en gjør i denne industrien. En finner løsninger som hjelper her og nå. Så forbedrer en de og finner nye. Hvilke ulemper refererer du forøvrig til med integrert minnekontroller?

 

Husk også på at noe sånt som 99.5% (tipp fra min side) av alle maskiner som selges er 1-2-veis. Ytelse i 4-veis og oppover er egentlig ikke _så_ interessant. Selv topp500-listen er bygget opp av 1-2-veis noder (ref tidligere samtale). Opteron skalere også sykt bra opp til 4-veis (se tester på nett). 8-veis har jeg ikke sett, men her snakker vi om promiller av markedet...

 

Hvorfor skulle forøvrig en delt 100 MHz FSB (Itanium har 100 FSB QDR på 128-bit) være bedre enn en integrert minnekontroller med "ubegrenset" minnebåndbredde og IO (Opteron)? Med 4 Itanium CPU-er får hver CPU "hele" 25 FSB (fortsatt QDR) på Intel sitt brikkesett. Det er ikke stort..

 

Litt pirk først. Latency øker ikke. CPU idle sykluser øker med økt multiplier.

 

Enig. Dårlig presisert av meg. Også enig i at latency reduseres med økning i FSB. Det er jo i grunn nesten hele forskjellen i ytelse mellom P4 med 133 og 200 FSB :)

Lenke til kommentar
Hvilke ulemper refererer du forøvrig til med integrert minnekontroller?

Ulemper med integrert minnekontroller: (det jeg kommer på i farta)

-Ikke kompatibelt med eksisterende prinsipper for chipset og dermed langt mindre knowhow og komponenter å velge i.

-Fordelen vil reduseres ettersom prosessorene blir mindre følsomme for latency mot minne grunnet, større cache, SMT og dual/multicore løsninger.

-Mindre fleksibilitet i valg av minne vil bli et større problem ettersom tiden går og nye standarder kommer. (DDR-II og XDR Rambus)

-Større cpu die.

-Samme avg. latency for 4-way system: (tok feil angående dette tidligere)

* 1/4 RAM direkte tilgang, lavere latency.

* 2/4 RAM via 1xHT, ~samme latency som chipset løsning.

* 1/4 RAM via 2xHT, høyere latency enn chipset løsning.

-Medfører behov for 1 til 3 ekstra busser fra cpu, som igjen gjør hk mer komplisert.

-Sikkert mer enn det jeg kan komme på.

Endret av Knick Knack
Lenke til kommentar
-Medfører behov for 1 til 3 ekstra busser fra cpu, som igjen gjør hk mer komplisert.

Mer komplisert enn hva? Mer komplisert men alikevel ikke så komplisert som med konvensjonell north bridge?

Kompabiltetsspørsmålet går begge veier.

Ulempe at dien blir større? Jeg vil kanskje tro at de 2% man legger til der bespares totalt sett når man kan gå ned fra 6 til 4 PCB layers.

 

Ja det er egentlig utrolig at noen velger å legge minnekontrollern ondie med alle ulempene den tar med seg.

Endret av b0nna
Lenke til kommentar
-Medfører behov for 1 til 3 ekstra busser fra cpu, som igjen gjør hk mer komplisert.

Mer komplisert enn hva? Mer komplisert men alikevel ikke så komplisert som med konvensjonell north bridge?

 

Ja det er egentlig utrolig at noen velger å legge minnekontrollern ondie med alle ulempene den tar med seg.

Mente mer komplisert enn konvensjonell northbridge ja.

 

Du må jo vekte fordelene og ulempene da! I dag så er det så stor fordel med lavere latency grunnet integrert minnekontroller at det oppveier for de ulempele jeg nevnte. Det er ikke sikkert det er tilfellet i 2005.

 

Tillegg: 2% større die size? Hvor får du det fra? Minnekontroller og interfase samt HT Technology er resultater av intern minnekontroller og tar da opp vesentlig mer enn 2%!

http://www.hardware.no/tester/cpu/athlon64_3000/kjerne.jpg

 

Beklager at jeg såret AMD hjertet ditt med en reality check.

Endret av Knick Knack
Lenke til kommentar
-Medfører behov for 1 til 3 ekstra busser fra cpu, som igjen gjør hk mer komplisert.

Mer komplisert enn hva? Mer komplisert men alikevel ikke så komplisert som med konvensjonell north bridge?

 

Ja det er egentlig utrolig at noen velger å legge minnekontrollern ondie med alle ulempene den tar med seg.

Mente mer komplisert enn konvensjonell northbridge ja.

 

Du må jo vekte fordelene og ulempene da! I dag så er det så stor fordel med lavere latency grunnet integrert minnekontroller at det oppveier for de ulempele jeg nevnte. Det er ikke sikkert det er tilfellet i 2005.

 

Tillegg: 2% større die size? Hvor får du det fra? Minnekontroller og interfase samt HT Technology er resultater av intern minnekontroller og tar da opp vesentlig mer enn 2%!

http://www.hardware.no/tester/cpu/athlon64_3000/kjerne.jpg

 

Beklager at jeg såret AMD hjertet ditt med en reality check.

Javel, vesentlige 5 % da?

'Ulempene' du nevner er uansett ubetydelige. I den grad de kan kalles ulemper, noe som kan diskuteres. Men det får vi ta i 2005.

 

Hadde intel klart å spå dagen i dag i 2000 så hadde de kanskje ikke droppet ondie memorycontroller prosjektet sitt? :p Men de hadde vel uansett droppet det med tanke på 2005.

 

AMD hjerte? javel. Det er iallefall hevet over envher tvil at du er mr IA64 Gospell.

Lenke til kommentar

Opprett en konto eller logg inn for å kommentere

Du må være et medlem for å kunne skrive en kommentar

Opprett konto

Det er enkelt å melde seg inn for å starte en ny konto!

Start en konto

Logg inn

Har du allerede en konto? Logg inn her.

Logg inn nå
  • Hvem er aktive   0 medlemmer

    • Ingen innloggede medlemmer aktive
×
×
  • Opprett ny...