'Re: [LLVMdev] Vectorized LLVM IR'

[prev in list] [next in list] [prev in thread] [next in thread] 

List:       llvm-dev
Subject:    Re: [LLVMdev] Vectorized  LLVM IR
From:       Stéphane_Letz <letz () grame ! fr>
Date:       2010-05-29 7:42:15
Message-ID: 45E47D93-A61E-4631-8D93-E2C295F1818B () grame ! fr
[Download RAW message or body]

Le 29 mai 2010 à 01:08, Bill Wendling a écrit :

> Hi Stéphane,
> 
> The SSE support is the LLVM backend is fine. What is the code that's generated? Do \
> you have some short examples of where LLVM doesn't do as well as the equivalent \
> scalar code? 
> -bw
> 
> On May 28, 2010, at 12:13 PM, Stéphane Letz wrote:

We are actually testing LLVM for the Faust language (http://faust.grame.fr/)

Currently Faust generates à C++ class from its .dsp Faust source file. So for the \
simple following Faust example : 

process = (+,+):*;

Which can be displayed as the following processor (takes 4 streams of float samples, \
do a "+" and then a "*" operation on the streams to produce a single output)

["plus.png" (plus.png)]

‰PNG

IHDRÇ±ÿ>MIiCCPICC ProfilexÕYgTË¶®î‰3¤!çœsÎ9ç†‡EDD” IE’ \
˜P	*D³(‚ ¨ ÁÈkôxÎ}ëÞûïýy½VW³÷®]5½+}»àœ§ÆÆFÁLDÓãÌ<<½pÏ ðV 
4¨	±†6à¿^«´¥|(»åë¿šýgsPpB \
¢JŒFðE`£ÀØøDPßùHJb,‚Ñ7ÌtÁ/¶pèo¼°…~aú—‹“1ðD*5>’"HEüLÀ²Ð‚ \
i=¬F €³±‘‰ŽŽÙ \
ý–ø?¡ÿ‚©Ô€¿}R©¡ãßÿ©‰4lžEMûõãÿ²ˆŽJBÞ×¯‹)‰´(»ØP{&ˆjb<yûglÔ¯˜!6W0ÍÕ‘maZ€ý_X/$ÞÌ	ÁH]È!6Ñh#ï
 ‰MtpùKž™fl‡`""?œ`úÇÏÑªÕVÌy[|’“+‚EÜ›ìlŠ`dDAïÒÃ\Üÿ²Y
6ùKÃ!áf–¿m`–ðDË¶X‘˜EÆXoõiVÖ 
ƒ$”4 l€10ù«”!€Šh’]ˆÓŽFjÄ ub,ð—ñ¿IÌ~ÕEêýo ±Mú»Íß	 \
mþñ‚üGNEÚØÒmõ.Á/<ûŸ6ÿXlùûÕ…&…Y…õ?}B‹¡•Ðªh#´.Z	Ð4E« \
5Ð†h}´6¢Ófàâ9ôO·üG·…$WÄ¤i¹…!ÚÿðGÜ~Y‡ÿýûßz \
ïÍ_šÿÓƒS‘y€qLlZ|xhX¢€!2sƒe,ir2J Š
[êÿ7×Öšõ»³KN¿Ö"ˆrÿYL,šµÈxløGF• \
ã2|ûÿ‘‰iÀØ@ßP`R|òoè#2B9È{Vj@S`ìð¾Èø	CÆ`<H`È U \
à,h—Àp‚a0ÆÀs0¦ÀX«` ‚ D‚È'Ä‰BÒ¤éA¦
äyBþP(Dƒ’ h7T•AUP=t:uA×¡[Ðè)ôš…¾@?`L„Ya^X–‡5`CØv·Á¡pœçÀEpÜ7Ãðuxƒ'à9xPô(
 J%‹Ò@£ìQ^¨T<*•*G5 ZPÝ¨!ÔCÔjõE“ÑhYdœZ ]Ñè8t&º]…nDw ûÑÑoÐèŸ†#Ñ \
Xb<0¡˜L.¦sÓŽÀŒa¦0«X,–‚Çªc-°žØìvl!ö¶Û‹}€Ä®àp8Nœ4Ng£âq¹¸J\3în7…û†§Çóã•ðfx/<
 Ÿ/ÇŸÁ÷àGñïñktLt¢tZtötAtitÅtÇéºéîÓMÑ˜	â]‚!‚°‹PAh!^–èéé…è5ééÃé³è+èÏÑß¤CÿÈB”" \
}ˆIÄ"â)b/ñ)q‰D"‰‘H^¤DRé4ééé™AŽÁ’!ˆa'C5CÃ(Ã'F:FQFCF_ÆtÆrÆŒ÷ç™è˜Ä˜Œ™¨L™LÕL]LãL+ÌdfEf{æhæBæ3Ì·˜gXp,b,¦,A,9,ÇXn°L’Qda²19¼›|œ<@žbÅ²Š³Z²F°°že½ÇºÀÆ \
¦ æÆ–ÊVÍv•m‚‚¢ˆQ,)Q”bJå1å;/»!{0{{û(ûWnŽ`Ž|ŽVŽ1Žœœ¦œ‘œ¥œ—8_r¡¹¤¸¹R¸j¹¸æ¹Y¹µ¹¹ó¹Û¸ŸñÀ<R<N<ÛyŽñÜáYáåã5çåä½Á;ÏGá3à‹à;È×Ã7ËOæ×ãç?Èÿƒ›€¡@”@…@¿À‚ \
 …`’`½à=Á5!q!W¡l¡V¡— a ááƒ } \
"ü"¶""M"ÏDéD5DÃD‹‰~sÛ+vIlFœCÜR<]¼Iü…IB_"N¢Aâ‘$VRC2Ròˆäˆ,¥*&U-u_–V“—>"ý@#£)C“i—%ÊÊ&Ë6É¾‘£ÈÙÈeË]’û$/"ï%_*?$ÿSAU!Já¸ \
sEE+ÅlÅnÅ/JRJJÕJ”IÊfÊ;•;•U¤U‚UjUž¨’UmU÷ªö©n¨©«Å«µ¨Íª‹¨û«×¨k°j8hjÜÔÄhiîÔ¼¢ù]KM+Q«Më³¶¬v¤öíq`ã:“ºBºTÝzÝ	==½£zú‚úTýý· \
A' ÞJF6~2R0Š7j7új¬e¼Ã¸×ebn’orÏ”ÅÔÕ´Êô•™Y¨Y“Ù‚¹ªùvó^Œ…µE©Å¸%¯e \
åiË+u«VýÖDkgë*ë·6R6ñ6Ý¶°•íÛv¢v4»KöÀÞÒþ€ýKq‡8‡ËŽXGÇjÇi'E§§!g²³ŸóçU#—b—ç®®I®}nŒn>n§Ý¾º›¸—¹OxÈ{ìðöäò÷ìô \
y¹yôZñ6õ>ä=å£ê“ëóx›ø¶Ôm·|¹|£|¯ú1úQý.øcüÝýÏø¯Sí© \
Ô•Ë€š€…@ãÀÃsAAƒfƒuƒË‚ß‡è†”…Ì„ê† Ó+›7¯
_Œ°ˆ¨‹øiy*r3Ê=ª5íÝEc¡EÒúcøbRcÄJÇæÆNÄiÅŠ[ˆ·Ž?™%lKèLdE‡w’$’ö$½IÖK®Nþ–â–r!•9•–z'M*-/í}ºYú‰íèíÛû23ve¼Ùa¸£>ÊÈìÛ)¼3gçT–yVã. \
®È]w³²Ë²—w»ïîÎáÍÉÊ™Üc¾§)—!7>w|¯öÞº}è}áûîå)çUæýÌÊ¿] \
PP^°^Xx{¿âþŠý›E!E÷ŠÕŠkK°%´’Ç¥ú¥eÌeée“lt8˜pùß¡[å*åu‡	‡“OTØTtVŠT–T®W…UUU·ÖðÔäÕ|=td´Ö \
¶¥Ž·® îÇÑð£OêÍë;ÄÊa%›>îv|è„Æ‰Ó'¹NœÜ8E;5ÑèÔØZýôé3<gŠ›à¦¤¦ÙfŸæ‘³&g;[d[ê[)çÀ¹¤s \
ÎûŸÜfÝÖwAãBËEÑ‹5íäöü¨#cáRØ¥‰NÏÎ]V]}ÝÚÝí—å.Ÿº"x¥ú*ÛÕâBONÏæµôk+½±½ó×C¯Oöùõ=¿áqãQ¿cÿ½ë›ƒfƒ7†‡®ÝÔ½yå–Ö®Û·/
 «
wÜQ½Ó~Wõnû=µ{÷ÕïwŽhŽt?ÐyÐ3ª?zý¡ÉÃÁG–†ÇìÆ<v}üdÜg|âIÐ“™§QOŸ%?[{žõó"ÿ%ÓËòW<¯^K¾nP› \
¸úÆäÍ·ÎoŸONÎ½Kx·>•3Mš.ÏÿþôŒÒÌ•Y³Ù‘Þ¦æbçÖæs?2¬ù$ñéâgƒÏw<¦ã7¿.q.ZVYî[qXyµ½ºö5ÿç·Æïß‡~¸ÿx¿–²Ž[¯ØÜèþiýóÅfôæf,5žúë,€BJ8$€/§á‰p‡½¿9Å/„®@ˆ
 ‚™‘SA/¤
‚%áFdW}€ŽÇbža+px}:a#=‰ÈLeÐeôaÚË|™e•U›m;å6…3œë:o"ßˆ€¬àan‘z1ñ’¦R£2Á²?äKÅ”n¨l \
Sý¡^¡©©5®“®Ç¥ßcH5†MÎ˜Ù™¯X±6²¹cG¶wt(v¼ëLr±u-r»ïÁäéâUî=¾Ë×Û¯Îÿm€h`DÐÙàÅPÕ°ôðk‘Ø(ÉhEšZŒ \
v¬aœY¼U‚]¢S’[²GŠgªWšWº×v÷.™Ž;m³¬v™eíÖÍQß£+µWlŸP_>wg!û~J{1{	g)Oÿáƒâ‡dË•kVèWš \
VYT[ÖX±©µ³?êXïÔà|Ìù¸ó	ç“N§íOÛž±j2o6=kÔ¢ßjpÎú¼o[ì…ÝËÛ;º.Ýî|Ñ5ß½v…p•³GüšJ¯Ñu»>ï¡ý \
‰Û†BozÝ²½7,‡ï.éîÚ½éû##]ŽŽæ>Œxd7¦ð˜åñòøØ“Ož>'=öâøËèWª¯Ö_÷Nd¿1y‹~Û7™ùNóÝòTËtÈ{ \
î÷3Q³äÙ®>6çjçuæÇ?Ò>¡?•û|aAwapÑfqô‹×—wKqKË{VH+%«äÕÒ¯_ó¾a¾íú¶ù}ßŽ7Ö¬ùÉ¸¹‰ÄŸ4@r¦³ƒZan89c…¢¦Ñè5L1VûwïN'F·N˜ \
@¼OzÎð‰‰È,ÏâO®d}FdåèåâàNã™ãKà_Ìf©“o—Ô’º.c$Û/o¨Ð¥¤¤\§JRKQ¦©¥u@ûƒ®ž^‰þ+C)£ãó&ÏÌ \
s	Ëd«Zë~›Y;{ewÇt§#Î=.¯Ý€»€‡§Ÿ×ïŸËÛžú~÷§§²pò‰Ë„(…j„é„DGšF™DÑq¡'/œÀ‘HLÜLZL~™r=õDZ^:m»K†ÖÁLBæÒÎ—Y·vµg7ì.ÉÙ±'*×{¯Í><™|Þ†BPøeÿTÑ“â»%}¥eg;Xu¨¸|Ïáô
 Z%µÊ¹Ú¤FåˆH-¹ª[:ºP¿Ô°zìûñµÈº¶Ñ¸qzíÌ÷¦¯Í«g—[¾´~9·p~¡mñ \
ÒÅ¯ð%R'G—P·ôe•+ÚWz,®Ùõ:_÷ìó½Ô17˜:´ëfÞ²Ûû‡sîdÜMº}?xÄçó¨ÕCƒGªc¹Ç‰ãOæž>y6ðüÜ‹Š \
—¯|_Nˆ¼Á½™};<Ùò®x*fÚþ½Üqfv¶ÿCí\Ê¼ÃGéOŒŸ¾ž^[úryéÜò©•ºÕŠ¯¥ßö}Ïü¿¼îºaôSv“ýWüÏ¨FÃTøÊÕƒð½^Œ)æ6Ö;‡Ë \
óà;é¼0á,½/‘B¼CÚÇ`ÅÈÈ8Æt”9†Å€ÌJžaíeë¤³Ïpb¹D¹x‚y÷ðà˜" +Š8ˆ&Š•‹wJ¼”ÒB2¦²árò
£Š«ÊÜ*êªâju¼úšZ´oê\ÕmÓkÔ¯58dXh”cœa’hmbîgáeéjå`mm£c+jG²[AN
CŽçªœs\h®žn&îržhÏÏ^Ï¼}Ú¶Õúø¥úSDÖGƒš‚w‡ø„ª„Ã¦ ¯F”GÒ¢L£y£—iÃ1ÇbÓãœâ%@ \
ƒÄª$¿dáä™”³©‰iZépúííe>;Äv,d^Þ¹7Ëy—À®ÙÝ»órÜ÷ˆíYÎ½±·l5O!äÔÆï7)¢Í_)). \
,S?@<ðæà¥C…åÁ‡M*D+q•³UÃÕ-5%GkÝë´ Ô£ëgîk?^}b×É°Söº§µÏ˜4Ù6»Ÿ
h‰nM=—{þ`Û±.ö·?î˜¹´ÞÅÔ-zYûŠÓÕøž×^_çAV—#ý“ƒ2Ci7oÞæŽ½3xÿ~ÚÈ£Qå‡%>=¶o}ÊøŒö|ýåÀëÃo¢'-§äßÏJÌ™|Lù<ôEyùê×à’øøÿÎ-mí	X5NÔà†ìö1Ô‡ \
ºðÎQH¸hx¥À¾*û{ÿÀ |“á™úÀ	Éd€2pô‚'`¢ƒ„!]ÈJ€Š¡&„û½‡1°(l \
‡À{á3ð]xar:¨@Ô^TjµŠæA› #ÑÐWÐÓ&„‘…`Ê0=˜y,' \
½R°§°ã8<N…«Ã=Äãð:øx|#þ5;]]ÝAƒH8GøH/MAšþÑžxŠHÞ¤„Å1Œ0*0–1®0y0]eAxÍ \
‹?Ë0Yƒ|’• šËú- á)n”»ì¦ì=Ãœa\8®Fnkîž
^#ÞÏ|GøíÐ—“„……/ˆ¤ŠˆÄÆÅOJ¤JÚJ‰Jé—2Ý²Urò~
&ŠÒJd¥
åY•1Õ~µ‹ê'5*5‹´öhgê¤ê¦èm×Ï6(0,7:n|ÑdÐô¹Ù’ƒ¥´•µuŒÍ!Ûkvs\Ž6NYÎ—\ÜDÜ<â<«½½—·‰øzøù€@½ \
Á}¡ø0§ðšˆù(ÝèÚt¬^Ü±‘Ä“É²)iæé/2’2Yv^Ú°›9g(7gŸY>©àÙþ¦â¬Ò¬û>Ü\y»z±Và¨wCýñ…S¶§/6‹´Ôžç¿ð²£¹+ÿJúµ¬¾ú©[ÖwÆGö=ò~ \
õüöë“ÍïgçíZ—Ï]øA[·Üèø9ókýÀ!99i$Ûå‡Ä¾ÉŒe$7 9B±P	taü_`2¬ »#¬þ \
å§¯€rC¥£jQ}¨4’OòAç \
Ï¢Ç1Fã…Ù‹éÀL#¬ÛaÛØ)7Î·wÆ!<ú–Îš®”î)AˆMè¦ÇÓ{ÐŸ!¢‰Äë$!Ri†Á–á"#/ã>Æe¦¦QfæK,²,'È|ÈŽEa=ÄFa«¤ðRŽ±K³·sèsŒs&r±pµq»rç9ÊkÉ» \
wœßU€ Ð'˜)¤#´)< R$ê#&+‰?“h—¬“*’Þ)/"·MÞMÁ^ÑZÉBÙ\ÅBÕJÍ^ÝMÃW3L+I{N¹î½kúãFôÆ&f¦¡fù \
æO¬PÖJ6Á¶5vØ=œjg\UÝRÜÏz¼÷öô9±mÞOÍ?›:(”ü(T>lø\¤mÔ9kLzìD¼^BmâfrPÊÝ4ôÆî¥;	Y¹ÙØÝ{÷rKö±ç-*l/2*~€ÄXñàdyE…}}õí#uŽõ<
 _?YÓ¸ýL@³]‹Þ9Õ6µ‹ÞqÝùWNõÜêýxƒsÀjhç«wÀ=›‘ÚÑÕ1×ñš§£/0¯Ô&‚Þ¿ëšžœ%Íi~ÿ|tñÅ²à*íÛÀšèFñ¯øc¤’arC2œà*˜‚!m(ª@fü:¬ˆäsêà§(6”*Õ…šG¢ÝÑÅè!$Öº˜tL'æV‰s/ƒ³Á \
½ÆKáSðƒtºPºËFB0á*=…>–þ>ÑØA’!gàc¨bä`¬`âbªEæq3‹KÙ<ÁÏ†e;BQ¡ÜcàÀs´rú!qâÞÉ£Á³Ì{/‘_C`P°TÈWXNˆŒ‰6‹í§JèKŠI	JóËðË
 ÉIÈ+)è)Ú)Q•SUÊTÏ©ª¯jòkYi§é4é®èÛœ2 \
›Ü4“5?d±iiýÜÖÆ®×AÝñ¼³¬K³›¬{»§ž×°×¶~ÙTÎ€AÁŸCKÃU#^DåÒ”bÞÄíOMINJåMÚž´C8óQÖ¾lýÝ_÷´íÉ“ÏÿRØQ´£D¹tð€÷ÁÅò¼
 ÁÊËÕ5Kµ%Gåêï‹>A:y®ÑñôjSõYÃ–™s%m¢Ž·uíäíª¸L¾RÐƒº–Úû±zãá€é`ÇM‰[UÃÄ;™wïSGÆF-^Sy|æ‰àÓªçl/J_Ž½ \
oÌÞ†M¼kšžž™g¹>ÈÎéÎ[~´ûäøÙvÁlQë‹äyéûò‹•îÕC_£¿|gùþúGóZâºÎúæFßÏìMÃø'„(+mí"!éÇW››KbàÊØ(ÝÜ\kØÜÜ8†
 äHoÔïï[ÆX$ç^s~ý§ë•,\ËgÅ	pHYsšœ,IDATxí]iPWö±¸ \
,ÊpIPÑ¨ˆe´Îˆ¨IEÔ²&MJMUªœ$UógþÏ¿üNUjªæGR:ÑI4jYFÅl \
&"‚–‚¢‚QŒO@—°Ígzæææ½gÓÝ÷¾^î;T*uûô9çžóõgw¿îÓçú‡Ñ! \
(©ÞÈ!ðbñ@>Ä*ù˜’Gbq@>Ä*ù˜’Gbq@>Ä*ù˜’Gbq@>Ä*ù˜’Gbq@>Ä*ù˜’Gbq@>Ä*ù˜’Gbq@>Ä*ù˜’Gbq@>Ä*ù˜’Gbq@>Ä*ù˜’Ç{ \
ðù|(Çÿ1_)ÏäšPSÖÑ‚0j¶ôÿ0!`«½F ~ ¥RVa˜ \
$·i¬Ú´iSnn.ó‹Áûï¿?vìX&áÏ4LˆÁóä¼Ž6ÔÔ7ß¿gg'?éÊ•+“’’˜äìÙ³õõõlƒ¼¼¼9sæ0‰ßï?tèÛÄ \
99¹¤¤„—ìÚµëÉ“'¼¤´´tôèÑLrüøñææf¶‰Á \
…§M›Æ$---•••lƒÌÌÌ¥K—ò’mÛ¶ñ›oÜ¸‘]°	ðÃëegg3É?þ¸xñb¶iz¬¥ü}ñÅ:~ÛkjÌ+óø<ƒåL‚Óä…4ÖG@ÿhêÛb¯´s;xözðDLÈ. \
Ð	)¶%‰Dìû ÈŸ%Ò²ï<¤W q8°ï\…s†vŒÙÉ# ¦9Ó	‡0`^ÚF`íÚµÁBãûX…˜WX|’€MM-B
B"RnPøì1’AU}µžžž¸¸¸çéà,%k¢çMAr÷ `ÓÁ&V¹çÛ‰M¬²!š \
=Ø÷Ð=9S$C"ÐØØ8¤ŽŽ±JœÈÝ…	"ÉKcÕÉ“'Eâ [•Æª€·W*aD¹˜E@«ÌNLú #@¬Røà:–±Ê1èÝ<ñŒ3D \
#V‰ §¬íÜ¹sEr“öpÞ¼yfãø×Þ-m(”3ëAŠþÊE¹³/X“â3 \
HcÕôéÓÍBy¥å~ÓM¿Y+éúD)éJc•åÈ:Û~¾pä?¾¨¨——lLHuàœqûö††¾‰'&$$XÎ‚yœ¿¯j8üïÎ¶«·›ÏWnç#³mÜ×ß÷ë¯¿Ø6£û'zðàHÎ³jðÿ‡“
 Dò![)”••‰ø‘Æª;wîX‹ãåâMcR²ÆOœY´Áš²rÒî«ð1Ð;ï¼c!½¤Œœ?møÈ‚!™¸iç*×fHÙ±Ê~ÌÕŸ‘X¥þ1 \
¶¡àCb•ÌÕ7A7‘$¥±*--M$²U	i¬*..V	ÊEiO†¢®®®¡¡¯ñ7fÌ˜!õIÁ»ØÇ*ôåILL¼téÒÖ[ÑÁÜ¢‡éÞå~ä&XuîÜ¹o¿ýVß]È½è±¤í \
ë¶ööö£G¢Rjn±/ù-¯Bšó ¤´‰1±#x	?îîìîü…mÒ@¬ZµÊ²¬B0¾	˜Ù)ñ \
²ªªêÊ•+“&Mzûí·ÑéëŸýd¶fT|âð£BNÝßß;Ìùb¡yOØÝÝ-´	VéO³sçÎõë×ëè´µµedd \
§›N;sÚå!¤±jÈJ¾ ¡‡¢P-  \
íÉ‚…¹MþùÞïÝ2]‘¹\<Ì*¹@7‰«$‚©Ž+Á76Òî«lC”¿ð±ñß¶\¶@Ã™Ú{MãÇç;T£KvLLL||¼·>,,,Ä9#ÊžÐ|»,UëÖ³/F \
PŠE¦ž2uFÞ¤<ïÀCZæ•ìQQQ “èÐ‡¥°*±J'Y#»¡fÄQtt´5êÄÅ' \
Ý>ÎUüš¦â„9íš2Q[™î«Ô>¾ÎdçaVI¹ü9ƒºëg=}ú´HŒf•HÚd«Šôô÷J»¯ \
;¾E‹éL†¦€W¯^E©BNNÎˆ¡ßë˜k»ºÚÛbbB·ò¸gHsR°i¬ºyó¦~Äx3=räHü#(//ÏÊÊzV	c¾Õ{w;U%èÃìŠ½&X¥_	ƒSQÀâ`,?¾ \
ŽŽŽêêj°0%·(*y&SSoPßÜöÓÙŸÏ+-9¾´x–a˜`Õo…0¿/‡å—_~©ÿ•)¨Å¹*55µ;XLð£íµf+a&uùæ¶Žïkÿ°ØŸ#OÍNq/«¹~ý:®€¨–á—rôé	s”¼6Ÿ<ðàîõìY‹'Lqàù;Ö¹D/`¼'HOO7ˆ˜[º¢
 îÌ™*_ìtÒo¹p´¹fî]¯_òÞÇ#ãÇê(‡cWWW—©ÇÔnéàˆaá@DŸO{þ×µgp \
¿÷ÉC22iÏ«ÐUlÈÉ"S!kÖŸÑôË™gÏ*“òB$€`ân=àGŽ#ãÆ¢éÍ@_Tt¤ \
-í\Žã¡’OoQêîÝ»"à«DÐSÖ¶¢¢B$7i¬ºvíšHd«ÒXUSS£.”‹ÒX%Ù*†±J±êŠtˆUÒ^ŒìØ±ãÌ™3xã)Í©CŽPo-2s¤<AÁÈ \
-Þr¾òÊ+x}ŽÞ$8*(õéíõj-ÿ²eËfRM«ðJÈ	t„+§ßïz„¯Sú\—!;u´NFvõõõ<xUåâûT \
}úé§Ñq	sÞ2âA1Ÿ…Ò9¹à³§ÞÞ^¹>-x{ñÅ-cÃ¦;þ<ÎU¨3Ã¿1œ«š~øl¿P8ó,2ÈLµùõ)ãÆ›2eŠˆã¶ÒÎUÆ§ÐÌÎÎ²óG€I86ùOLù×
 NPš±zõêØØgeÐWü¹Ò¬Ê>ÞXò÷í"œ²užUâg§°˜÷UkÖ¬	ZÛŸ4Cmà9n9Ï*k¸«m¥ÑÈÁsÕîÝ»×®]kdiOp‹j92F@£;i+„U \
ßé¢Ý£GLM'U{öì151)ë# \
®ÜpíC7GüžE/E|ðb^tÔ?¸*ìíéj¯«ëB7ò€Õöü~JJJÈ›ššðÛ•ŸŸ[|r·eË45ùàƒð1Û<v® \
vMõðù|F’¢s•”¼—”—gîy>ˆzõÕWµ´ñ}Î¡C‡&L˜€îhîjä±ÊÛŒ	Sô¥¥¥Ì3.›7o6B&f"Uˆ±‰iàf†Î \
³°î•´ûª·ÞŠÄ^zðHcï42Çxc³oß¾‹/ò{" iWÀÈ„ÏolÐDé …ß}÷övÙ
ï7ùm;Éª#§®¡Æ¶TŸ7QÞÔô—^HØ‹u \
Ž9‚†Ÿò›xNˆbh{ñš«}òÉ'Þ„ÁÃ*ö0dÊúB'YuðØ%7ô„ùëšùÁ¬BÑº2ãéŸ>|{Ñö \
W@¬…á¨„¹Þ½µì\€Ž'6ù'–Æª~øaùòå"è}Òós]¹Ï5yî²˜á¡×Ó²àÖ¸I{Gši¡ÿÑ¨QB³ã¾êÄ‰ \
[ªµJ¨Æx nÓ”Æª{÷îYËîûÏ~¹v¶Ýþ[ù+>´æDÄ
=ø<úÖ²
÷UX¡N$elÿ
ØíoÑÐdeÀØDœgÕäü×Cß79ÿµˆ=Š%.í
hÜN¥çÌ6,Êþva–cVÞ°  @$GçY…èGÆ'‰ä@¶Ò˜<y²ˆOiWÀ¥K—ŠÄA¶*! \
U¨”P	ÊEi¬	‚lC€X¥Ø•“Î7D«DÐSÖöØ±c"¹IcUcc£~P8~ü8Î¨’{¥=YÀg=úßÑ:ßià \
¼ÙÀx_¦‚”E0&X%ku$\³Qgòì…nn‘OéÕ‘&¦{maÚY=~ü8zÛ$ãâC¯}¾L°Jpu$”°]¾|-SPe>O8Wm)¿ÑÜr?|¹9îyvNþ»uë–`£iÇ1€	V™u \
S¶êäo¼¡:é«¸ £ä&ª!L!&pãaÜ3õWÖ´UXÆIp%§àè=!«ðç‰PYúËÒ2µç \
¤ý´ÿîÛ©ÎÏƒ’äi¬š7uôG<C@«NB€!`ß}›RpÀ_øØX¤#OÏÃ®û÷‡á»ï§OŸ²Ø°8´çn†Xðâ,T)òÃ{¬b¥ØXÇkMnàÃ¾•@gg§ÙlDbp›íW_}¥¿Š¶~ÀÒX…5X=ú{Vþ \
…Ó’¥ô0ÖÇ:röJ»¯BÃñÈA2ÕG@«ô§	Ç^)—¿pF>=Ì*:x®EÀ>Vá% \
+¹öXJÍ?E¼I»[24×ªªªb+¡à&¤àë×¯™Ú«ô+aP”‡õ[B†ÒÚÚš™™©íBåVÚ»w/”Sgû’ôZá†ôFB÷#`‚Uú•0FRE
  Z¦ ër^^Þî¨ºÛ|«Ýˆ!éx¬L¬®®®¡¡d*,,ÄƒlxÛYý O2w'ö±
ç'ü¹ŠJ.B·úrC!oîAàðáÃ"Á«DÐSÖ+"‰ä&Uè„)Ùª„€4V¡ãªJ¸P."Hc•Hd«Ä*Å¨+Ò!V¹â0¸-ˆ%K– \
ˆ„D¬AOYÛôôt‘Ü¤±ª¤¤D$²U	i¬JLLT	ÊEi¬	‚lCÀ¾÷€ÁÀ½”•<"6úaOÏàÀ@ð^Û$‰£ín™b[j–'B‰¥Hœ“¬úð/v}}=-¨gùð‡ÉðÔ©S®`ª‡}@‡Ð°Z˜Ð1î–_Ö¸i†D@Ú¹
 åxÖX•••22zº[÷î±soäÄ*÷ïFF¬òî±cäS§NñN¬AOYÛùóç‹ä&UT“.r³õ
*–¥ã8ÒÎUŽgB¸b•{Ž…‹"ÁÊ"Ñ«DÐSÖöë¯¿ÉM«è]žÈaPÌV«vïÞ4”Že¤±Êrd¨Ä*õŽ©óI«Y@×çŸÎ'´nÝ:~Ežêêêææf^¡ \
€3€µÝ*++y”33	mÛ¶mjƒwß}——TTT`+^|Yâ¬©©á"a¬º¶k×.¶‰²@.¼¤¬¬Ìï÷ó’+V¤¦¦2	ààmb0{öl¾¦«o|íŠ \
Õ«Wó&{öì	ø-öæ›oÆÇÇ3ÚÚZ¬aÆ61X°`Ö^dt+//g›ddd,_¾œ—lß¾MÅxÉ† ø&áü.ƒcz
j(R3]M€Eª VŠÔL @¬2©D€Xe(R3±ÊX¤jb•A HÍÄ*`‘ªAˆU"5«L€Eª \
VŠÔL @¬2©D€Xe(R3±ÊX¤jb•A HÍÿ™7Òe…{IEND®B`‚

For scalar code in C++ code is :

virtual void compute (int count, FAUSTFLOAT** input, FAUSTFLOAT** output) {
		FAUSTFLOAT* input0 = input[0];
		FAUSTFLOAT* input1 = input[1];
		FAUSTFLOAT* input2 = input[2];
		FAUSTFLOAT* input3 = input[3];
		FAUSTFLOAT* output0 = output[0];
		for (int i=0; i<count; i++) {
			output0[i] = (FAUSTFLOAT)(((float)input2[i] + (float)input3[i]) * \
((float)input0[i] + (float)input1[i]));  }
	}

The "vectorized" C++ code is : 

virtual void compute (int fullcount, FAUSTFLOAT** input, FAUSTFLOAT** output) {
		for (int index = 0; index < fullcount; index += 32) {
			int count = min(32, fullcount-index);
			FAUSTFLOAT* input0 = &input[0][index];
			FAUSTFLOAT* input1 = &input[1][index];
			FAUSTFLOAT* input2 = &input[2][index];
			FAUSTFLOAT* input3 = &input[3][index];
			FAUSTFLOAT* output0 = &output[0][index];
			// SECTION : 1
			for (int i=0; i<count; i++) {
				output0[i] = (FAUSTFLOAT)(((float)input2[i] + (float)input3[i]) * \
((float)input0[i] + (float)input1[i]));  }
		}
	}

(so basically the C++ code is separated in "vectors" [here 32 samples] to be computed \
in separated loops that can be auto-vectorized by some compilers like Intel ICC, this \
works quite well...)

The scalar LLVM code is : 

define void @llvm_compute(%struct.llvm_dsp*  %obj, i32 %count, float** noalias \
%inputs, float** noalias %outputs) nounwind readnone ssp {  entry:
	    %input_array_ptr0 = getelementptr inbounds float** %inputs, i64 0
	    %input0 = load float** %input_array_ptr0, align 8
	    %input_array_ptr1 = getelementptr inbounds float** %inputs, i64 1
	    %input1 = load float** %input_array_ptr1, align 8
	    %input_array_ptr2 = getelementptr inbounds float** %inputs, i64 2
	    %input2 = load float** %input_array_ptr2, align 8
	    %input_array_ptr3 = getelementptr inbounds float** %inputs, i64 3
	    %input3 = load float** %input_array_ptr3, align 8
	    %output_array_ptr0 = getelementptr inbounds float** %outputs, i64 0
	    %output0 = load float** %output_array_ptr0, align 8
	%out = icmp sgt i32 %count, 0
	br i1 %out, label %convert, label %return
	convert:
		%count_64 = zext i32 %count to i64
		br label %loop
	loop:
		%indvar = phi i64 [ 0, %convert ], [ %indvar.next, %loop ]
		%output_ptr0 = getelementptr float* %output0, i64 %indvar
		%input_ptr1 = getelementptr float* %input1, i64 %indvar
		%fTemp0 = load float* %input_ptr1, align 4
		%input_ptr0 = getelementptr float* %input0, i64 %indvar
		%fTemp1 = load float* %input_ptr0, align 4
		%fTemp2 = fadd float %fTemp1, %fTemp0
		%input_ptr3 = getelementptr float* %input3, i64 %indvar
		%fTemp3 = load float* %input_ptr3, align 4
		%input_ptr2 = getelementptr float* %input2, i64 %indvar
		%fTemp4 = load float* %input_ptr2, align 4
		%fTemp5 = fadd float %fTemp4, %fTemp3
		%fTemp6 = fmul float %fTemp5, %fTemp2
		store float %fTemp6, float* %output_ptr0, align 4
		%indvar.next = add i64 %indvar, 1
		%exitcond = icmp eq i64 %indvar.next, %count_64
		br i1 %exitcond, label %return, label %loop
	return:
		ret void
}

And the vectorized LLVM code is : 

define void @llvm_compute(%struct.llvm_dsp* noalias %obj, i32 %count, <32 x float>** \
noalias %inputs, <32 x float>** noalias %outputs) nounwind readnone ssp {  entry:
		    %input_array_ptr0 = getelementptr inbounds <32 x float>** %inputs, i64 0
		    %input0 = load <32 x float>** %input_array_ptr0
		    %input_array_ptr1 = getelementptr inbounds <32 x float>** %inputs, i64 1
		    %input1 = load <32 x float>** %input_array_ptr1
		    %input_array_ptr2 = getelementptr inbounds <32 x float>** %inputs, i64 2
		    %input2 = load <32 x float>** %input_array_ptr2
		    %input_array_ptr3 = getelementptr inbounds <32 x float>** %inputs, i64 3
		    %input3 = load <32 x float>** %input_array_ptr3
		    %output_array_ptr0 = getelementptr inbounds <32 x float>** %outputs, i64 0
		    %output0 = load <32 x float>** %output_array_ptr0
		    %out = icmp sgt i32 %count, 0
		    br i1 %out, label %convert, label %return
		convert:
			%count_64 = zext i32 %count to i64
			br label %loop0
		loop0:
			%indvar = phi i64 [ 0, %convert ], [ %indvar.next, %loop0 ]
			%output_ptr0 = getelementptr <32 x float>* %output0, i64 %indvar
			%input_ptr1 = getelementptr <32 x float>* %input1, i64 %indvar
			%fVector0 = load <32 x float>* %input_ptr1, align 16;
			%input_ptr0 = getelementptr <32 x float>* %input0, i64 %indvar
			%fVector1 = load <32 x float>* %input_ptr0, align 16;
			%fVector2 = fadd <32 x float> %fVector1, %fVector0;
			%input_ptr3 = getelementptr <32 x float>* %input3, i64 %indvar
			%fVector3 = load <32 x float>* %input_ptr3, align 16;
			%input_ptr2 = getelementptr <32 x float>* %input2, i64 %indvar
			%fVector4 = load <32 x float>* %input_ptr2, align 16;
			%fVector5 = fadd <32 x float> %fVector4, %fVector3;
			%fVector6 = fmul <32 x float> %fVector5, %fVector2;
			store <32 x float> %fVector6, <32 x float>* %output_ptr0, align 16

			%indvar.next = add i64 %indvar, 1
			%exitcond = icmp eq i64 %indvar.next, %count_64
			br i1 %exitcond, label %return, label %loop0
		return:
			ret void
}

We tried to play with the "align" on the load/store or "noalias" on the compute \
function parameters without real change.

Do you see anything clear that not correct in the generated vectorized LLVM code? \
Maybe the memory bandwidth is the limiting factor in this simple example without much \
computation on the samples?

Thanks.

Stéphane Letz

_______________________________________________
LLVM Developers mailing list
LLVMdev@cs.uiuc.edu         http://llvm.cs.uiuc.edu
http://lists.cs.uiuc.edu/mailman/listinfo/llvmdev

[prev in list] [next in list] [prev in thread] [next in thread]