COMP.ARCH---------------- < Пред. | След. > -- < @ > -- < Сообщ. > -- < Эхи > --
 Nп/п : 61 из 100
 От   : Stephen Fuld                        2:5075/128        29 сен 23 09:06:16
 К    : Anton Ertl                                            29 сен 23 19:09:03
 Тема : Re: lotsa money and data sizes, Solving the Floating-Point Conundrum
----------------------------------------------------------------------------------
                                                                                 
@MSGID: 1@dont-email.me> 95248085
@REPLY: <2023Sep29.095547@mips.complang.tuwien.ac.at>
13549f04
@REPLYADDR Stephen Fuld
<sfuld@alumni.cmu.edu.invalid>
@REPLYTO 2:5075/128 Stephen Fuld
@CHRS: CP866 2
@RFC: 1 0
@RFC-Message-ID: 1@dont-email.me>
@RFC-References:
<57c5e077-ac71-486c-8afa-edd6802cf6b1n@googlegroups.com> <2023Sep23.123024@mips.complang.tuwien.ac.at> 2@gal.iecc.com>
<09798d75-4962-47b8-8816-d554d201a522n@googlegroups.com> 1@gal.iecc.com> 1@newsreader4.netcologne.de>
<e2196cd2-5268-4b04-b7ad-19b5b2a4cb8fn@googlegroups.com> <8734z3auj4.fsf@localhost>
<2023Sep29.095547@mips.complang.tuwien.ac.at>
@TZUTC: -0700
@PID: Mozilla Thunderbird
@TID: FIDOGATE-5.12-ge4e8b94
On 9/29/2023 12:55 AM, Anton Ertl wrote:
> Lynn Wheeler <lynn@garlic.com> writes:
>> they other thing part of z10->z196 was claim that at least half of the
>> per processor thruoughput increase was introduction of out-of-order
>> execution, branch prediction, etc

> Speculative execution and OoO can provide very big speedups, but it
> depends on benchmarks.  E.g., the fastest in-order CPU on the LaTeX
> benchmark is the Cortex-A55; on the LaTeX benchmark it is slower than
> a Cortex-A76 (on the same RK3588 SoC) by a factor 3.6 and slower than
> Firestorm (on Apple M1) by a factor 7.8.

> OTOH, I expect that for dense matrix multiplication one can get the
> same throughput with in-order cores as with out-of-order cores, as
> long as the resources are the same.

That may very well be true, but the "typical" workload executed on Z 
systems is much more like Latex than matmul. so IBM`s statement might 
very well be true also.

Also, Lynn`s post talked about branch prediction being a part of the 
improvement, which is just as beneficial, perhaps even more so to OoO 
cores than in order ones, and may even benefit matmul.



-- 
  - Stephen Fuld
(e-mail address disguised to prevent spam)

--- Mozilla Thunderbird
 * Origin: A noiseless patient Spider (2:5075/128)
SEEN-BY: 5001/100 5005/49 5015/255 5019/40 5020/715
848 1042 4441 12000
SEEN-BY: 5030/49 1081 5058/104 5075/128
@PATH: 5075/128 5020/1042 4441



   GoldED+ VK   │                                                 │   09:55:30    
                                                                                
В этой области больше нет сообщений.

Остаться здесь
Перейти к списку сообщений
Перейти к списку эх