Új hozzászólás Aktív témák
-
thgergo
tag
Még futtattam teszteket AVX2 AVX512-re fordítva, közel azonos frekvenciákra limitálva ~2GHz tehát közel IPC-t jelentenek a százalékok:
AMD K10 "Magny Cours": ~60% (128 bit simd)
Westmere-E: ~100% (128 bit simd)
Sandy-E: ~130% IPC AVX1 fordítás (256 bit simd)
Haswell-E: ~160% IPC AVX2 fordítás (256 bit simd)
Skylake-SP: ~175% IPC SSE4.1 fordítás
Skylake-SP: ~190% IPC AVX2 fordítás (2x256 bit simd párhuzamosan)
Skylake-SP: ~195% IPC AVX512 fordítás (512 bit simd)Látható, hogy egyre kevesebb az utasítások értelezésére fordítandó "overhead" SSE-AVX-AVX512 útvonalon, ami szintén megkérdőjelezi, kell-e az AVX512 egyáltalán.
[ Szerkesztve ]
-
-
thgergo
tag
"Tehát két darab 256 bites vektorral dolgozó mag nem lesz olyan hatékony, mint egy 512 bites vektorral dolgozó mag (feltéve, ha azonos az órajel), hiába engedi meg maga az AVX-512 az ilyen irányú skálázást."
Nekem úgy tűnt ez a lefele skálázás nagyon is jó, lásd előző posztot.
Az intel az alapabb bronze-silver-gold Xeonokon letiltja (3xxx-4xxx-5xxx) a dupla AVX FMA unitot.
https://community.intel.com/t5/Intel-ISA-Extensions/State-of-AVX-512-on-Skylake-X/td-p/1143063Nem vagyok benne biztos, de ez nem azt jelenti, hogy a "2x256 bit párhuzamos" lefele skálázott AVX2 működést is letiltja vele? Nem lehet, hogy csak ebből származik a ebből származik sok esetben a lefele skálázás hibája? AVX512 utasításokkal mintha nem lenne külömbség, egy "FMA" port is elegendő.
[ Szerkesztve ]
-
-
KisDre
senior tag
Új hozzászólás Aktív témák
- Hobby rádiós topik
- Autós topik látogatók beszélgetős, offolós topikja
- ASUS ROG PG32UCDM: OLED csúcsmonitor tesztje
- Multimédiás / PC-s hangfalszettek (2.0, 2.1, 5.1)
- Melyik tápegységet vegyem?
- Folyószámla, bankszámla, bankváltás, külföldi kártyahasználat
- Xiaomi 11 Lite 5G NE (lisa)
- HiFi műszaki szemmel - sztereó hangrendszerek
- OLED TV topic
- Xbox Series X|S
- További aktív témák...
Állásajánlatok
Cég: Ozeki Kft.
Város: Debrecen
Cég: Alpha Laptopszerviz Kft.
Város: Pécs