چرا Sandy Bridge؟
اجازه دهید قبل از این‌كه به بررسی جزئیات كامل معماری پردازنده‌های مبتنی بر Sandy Bridge بپردازیم، این موضوع را بررسی کنیم كه چرا اینتل تصمیم به تعویض معماری پردازنده‌هایش گرفت. همان‌طور كه می‌دانید، پردازنده‌های مبتنی بر معماری Nehalem، هم از كارایی بالایی برخوردار هستند، هم این‌كه مورد استقبال بازار واقع شده‌اند. علاوه بر این، رقیب اصلی اینتل یعنی AMD نیز نتوانسته محصولی ارائه كند كه رقیبی جدی برای پردازنده‌های اینتل به شمار آید و بیشتر پردازنده‌های رایج این شركت از پردازنده‌های مبتنی بر معماری Nehalem ضعیف‌تر هستند. اما دلیلی كه موجب شده تا اینتل معماری جدیدی معرفی كند، نقایص معماری Nehalem است كه مهندسان اینتل را مجبور كرده تا با وجود تمام مشكلاتی كه بر سر راه معرفی یك معماری جدید وجود دارد، معماری جدیدی برای پردازنده‌های خود معرفی كنند. شاید از موارد زیر بتوان به‌عنوان ضعف‌های معماری Nehalem نام برد.

 http://s4.picofile.com/file/7799928488/pic1.jpg

اولین ضعفی که در این میان وجود دارد، این است که آخرین نسل از پردازنده‌های مبتنی بر معماری Nehalem یعنی پردازنده‌‌های مبتنی بر خانواده Westerme، فرآیند ساخت پیچیده‌ا‌‌ی داشتند. آن‌ها دارای دو هسته مجزا با دو فرآیند ساخت متفاوت بودند (هسته پردازنده فرآیند ساخت 32 نانومتری داشت و پردازنده‌گرافیكی 45 نانومتری بود). دوم این‌که، پردازنده‌های مبتنی بر معماری Nehalem به حداكثر میزان فركانس رسیده‌بودند یا به عبارت دیگر، اینتل با این معماری دیگر قادر به افزایش فركانس پردازنده‌های خود نبود، بنابراین تنها روش برای افزایش كارایی پردازنده، تغییر در ساختار معماری پردازنده بود.

مشخصات كلی
از دو سال پیش تاكنون اینتل سعی كرده عملكردهای مربوط به چیپ‌ست‌ها را به تدریج به درون پردازنده انتقال دهد. در اولین پردازنده مبتنی بر معماری Nehalem (یعنی Bloomfield) وظیفه كنترل حافظه از چیپ‌ست مادربورد به درون پردازنده انتقال یافت. به عبارت دیگر، كنترلر حافظه به جای چیپ‌ست مادربورد در پردازنده گنجانده شد. در خانواده بعدی پردازنده‌های اینتل یعنی Lynnfield، علاوه بر كنترلر حافظه، كنترلر رابط PCI-Express نیز به درون پردازنده منتقل شد. بعد از این موضوع، در پردازنده‌های Clarkdale، پردازنده‌گرافیكی نیز در پردازنده‌مرکزی گنجانده شد. اگرچه این هسته به‌طور مستقیم، داخل خود هسته پردازنده گنجانده نشد اما به هرحال وظیفه پردازش گرافیكی سیستم، به جای چیپ‌ست‌های گرافیك مجتمع به پردازنده منتقل شد. اما اكنون در Sandy Bridge همه‌چیز درون پردازنده گنجانده شده‌است. به عبارتی، در این معماری هسته گرافیكی، كنترلر حافظه و كنترلر رابط PCI-Express درون هسته پردازنده گنجانده شده‌اند.

http://s4.picofile.com/file/7799928816/pic2.jpg

معماری Sandy Bridge از نظر مشخصات كلی تفاوت چندانی با نسل قبل نداشته‌است. پردازنده‌های مبتنی بر این معماری 32 نانومتری هستند و  مانند پردازنده‌های نسل قبل، دو یا چهارهسته‌ا‌ی خواهند بود كه از فناوری Hyper Threading نیز پشتیبانی می‌كنند و دارای حداكثر هشت مگابایت حافظه نهان سطح سه، كنترلر حافظه دوكاناله DDR3، كنترلر رابط PCI-Express نسخه دو با پشتیبانی از شانزده مسیر و در نهایت، دارای یك واحد پردازش‌گرافیكی با قابلیت پشتیبانی از رابط DirectX 10.1 هستند.
پیشرفت‌های انجام‌شده در معماری Sandy Bridge بیشتر در ریزمعماری و واحد‌های اجرایی درون هسته است. به‌طوری كه ریزمعماری هسته‌های محاسباتی تغییرات جدی داشته و این موضوع موجب شده تا پردازنده‌های جدید به‌طور قابل توجهی سریع‌تر از پردازنده‌های نسل قبل در فركانس یكسان عمل كنند. مهندسان اینتل همچنین برای كاهش حرارت پردازنده، كارهای متعددی انجام داد‌ه‌اند، بنابراین پردازنده‌های مبتنی بر Sandy Bridge قادر خواهند بود به سادگی در ضریب كلاك‌های بالاتر عمل كنند. علاوه بر این، پردازنده‌های جدید از دستور‌العمل‌های AVX يا Advanced Vector Extension جدیدی نیز پشتیبانی می‌كنند كه برای تعدادی از الگوریتم‌های چندرسانه‌ای، مالی یا علمی موردنیاز خواهد‌بود. AVX با مجموعه دستورالعمل‌های قبل SSE تفاوت دارد. این دستورالعمل‌ها دارای عرض باند بالاتری هستند (265 بیت به جای 128 بیت) و بنابراین اجازه خواهند داد، میزان داده‌های وسیع‌تری پردازش شوند. در ادامه مقاله، به بررسی جزئیات تحولات انجام‌شده در معماری جدید خواهیم پرداخت.

http://s4.picofile.com/file/7799929672/pic3.jpg

اینتل انتظار دارد، پردازند‌ه‌های مبتنی بر Sandy Bridge به سرعت مورد استقبال بیشتر خریداران قرار گیرد. آن‌ها قصد دارند، گستره وسیعی از پردازنده‌های Core i5 ،Core i3 و Core i7 مبتنی بر این معماری جدید را با قیمتی بین صد تا سیصد دلار در همین آغاز كار به بازار عرضه كنند و در انتهای سال 2011 نیز قصد دارند، پردازنده‌های گران‌قیمت‌تر مبتنی بر این معماری عرضه كنند.

http://s4.picofile.com/file/7799930000/pic4.jpg

پردازنده‌های معرفی‌شده در تصویر بالا، برای كامپیوترهای خانگی هستند اما پردازنده‌های 65 و 45 واتی تصویر زیر برای كامپیوترهای همراه در نظر گرفته شده‌اند.

http://s4.picofile.com/file/7799930321/pic5.jpg

این پردازند‌ها در حقیقت جایگزین پردازند‌های مبتنی بر سوكت 1156 خواهندشد و اینتل قصد ندارد تا اواخر سال 2011 میلادی جایگزینی برای پردازند‌ه‌های مبتنی بر سوكت 1366 معرفی كند. اینتل در حقیقت قصد دارد پردازنده‌های حرفه‌ا‌ی مبتنی بر معماری Sandy Bridge را در اواخر سال 2011 میلادی معرفی كند. این پردازنده‌ها مبتنی بر سوكت 2011 خواهندبود و دارای هشت هسته پردازشی، شانزده مگابایت حافظه نهان سطح سه، كنترل‌كننده حافظه چهاركاناله، 32 مسیر PCI Express نسخه سه و به احتمال چند فناوری جذاب دیگر هستند.
پردازند‌ه‌های مبتنی بر Sandy Bridge با سوكت 1155 سازگار هستند و این سوكت با پردازنده‌های مبتنی بر معماری Nehalem سوكت 1156 سازگاری ندارد. اینتل همچنین برای این نسل از پردازند‌های خود چیپ‌ست‌های جدید معرفی كرده‌است. با توجه به این‌كه تمامی وظایف مرتبط با پل‌شمالی به پردازنده محول شده، چیپ‌ست‌های ‌P67 و H67 بسیار ساده هستند. این چیپ‌ست‌ها مانند نسل قبل تك‌چیپ‌ست هستند اما تفاوت عمده آن‌ها نسبت به چیپ‌ست‌های نسل قبل پشتیبانی از دو پورت SATA نسخه سه و عدم  پشتیبانی از رابط‌‌های PCI سنتی است. متأسفانه این چیپ‌ست‌های جدید مشابه نسل ماقبل خود فاقد قابلیت پشتیبانی از پورت USB 3.0 هستند.

http://s4.picofile.com/file/7799930856/pic6.jpg

افزایش كارایی از چه روشی؟
شركت اینتل در معماری Sandy Bridge چندین تغییر غیرمنتظره ایجاد كرده كه به موجب آن كارایی پردازنده افزایش و در مقابل مصرف توان و درجه حرارت آن كاهش پیدا كرده‌است. در حقیقت، Sandy Bridge معماری توسعه‌یافته Nehalem نیست، بلكه این معماری تركیبی از معماری Nehalem با پروژه به ظاهر شكست‌خورده پنتیوم 4 است. بله؛ درست متوجه شده‌اید، اگرچه معماری NetBurst شركت اینتل مدت زمان زیادی است كه به دلیل مصرف توان ناكارآمد منسوخ شده اما اكنون از برخی واحد‌های پردازنده‌های پنتیوم 4 در پردازنده‌های Core i5 ،Core i3 و Core i7 جدید استفاده شده‌است. شاید شنیدن این نكته جالب باشد كه اینتل عنوان كرده، اقتباس برخی از بخش‌ها از پنتیوم 4 فقط برای افزایش كارایی نبوده بلكه بیشتر برای كاهش مصرف توان بوده‌است.
تغییرات انجام‌شده در معماری Sandy Bridge را با بررسی خط لوله‌ها آغاز می‌كنیم. در ابتدای خط لوله‌ها، رمزگشاها قرار دارند كه  همچون گذشته دستورالعمل‌های x86 را به Micro-ops ساده‌تر رمزگشایی می‌كنند. رمزگشاها در معماری جدید مشابه با Nehalem در هر سیكل چهار دستورالعمل پردازش می‌كنند و مانند گذشته از فناوری Micro-Fusion و Macro Fusion نیز پشتیبانی می‌كنند. اما در معماری جدید، دستورالعمل‌های رمزگشایی‌شده به Micro-Opsها به جای این‌که به مرحله بعدی پردازش بروند، ذخیره می‌شوند. در حقیقت، Sandy Bridge یك حافظه سطح صفر اضافی برای ذخیره نتایج رمزگشایی دارد. این حافظه نهان اولین بخشی است كه از معماری NetBurst برگرفته شده‌است. عملكرد كلی این حافظه نهان مشابه Execution Trace Cache است كه در پردازنده‌های پنیتوم 4 به‌كار گرفته شده‌بود.

http://s4.picofile.com/file/7799940214/pic7.jpg

حافظه نهان Micro-Opsهای رمزگشایی‌شده حدود شش كیلوبایت است كه می‌تواند حداكثر یک‌هزار و پانصد Micro-Ops در خود ذخیره كند. اكنون اگر رمزگشا دستورالعملی دریافت كند كه قبلاً ترجمه كرده و در حافظه نهان نیز ذخیره شده، دوباره آن دستورالعمل را رمزگشایی نمی‌كند و از Micro-Ops مربوط به آن دستورالعمل كه در حافظه نهان Micro-Ops ذخیره شده، استفاده می‌كند. بنابراین حافظه نهان Micro Opsهای رمزگشایی‌شده به حذف بار اضافی از رمزگشاها كمك می‌كند و همچنین موجب كاهش مصرف انرزی پردازنده می‌شود. بنابر گفته مهندسان اینتل در هشتاد درصد مواقع دسترسی به این حافظه نهان اضافی موردنیاز است. گذشته از این، زمانی كه رمزگشا‌ها در معماری Sandy Bridge بیكار هستند، غیر‌فعال می‌شوند كه این موضوع به كاهش مصرف توان پردازنده كمك می‌كند.
دومین پیشرفت مهم در خط لوله‌ها مربوط به واحد پیش‌بینی انشعاب است. این واحد از اهمیت بسزایی در پردازنده‌ها برخوردار است زیرا هر پیش‌بینی انشعاب نادرست نیازمند توقف و تخلیه خط لوله‌ها به‌طور كامل است. در نتیجه، یك پیش‌بینی اشتباه نه تنها روی كارایی اثر منفی دارد، بلكه موجب افزایش توان مصرفی برای پر كردن دوباره خط لوله می‌شود. اینتل به این واحد در پردازنده‌های جدید توجه ویژه‌‌ای كرده تا آن‌ها به‌طور موثرتری عمل كنند. این شركت همه بافرهای Sandy Bridge را كه برای ذخیره آدرس‌های انشعاب‌ها و تاریخچه پیش‌بینی به‌كار گرفته شده، به منظور افزایش حجم ذخیره‌سازی در آن‌ها اصلاح كرده‌است. در نتیجه Sandy Bridge اكنون قادر است تاریخچه پیش‌بینی انشعاب‌های طولانی‌تری ذخیره كند. این موضوع تأثیر زیادی روی كارایی واحد پیش‌بینی انشعاب می‌گذارد. مطابق برآوردهای اولیه، درستی پیش‌بینی انشعاب در Sandy Bridge به بیش از پنج درصد در مقایسه با نسل قبل بهبود پیدا كرده‌است.

http://s4.picofile.com/file/7799940749/pic8.jpg

همان‌طور كه گفته شد، واحد پیش‌بینی انشعاب در پردازنده‌های غیرترتیبی از اهمیت بالایی برخوردار است و اغلب، سازندگان با معرفی یك معماری جدید تغییراتی در این واحد اعمال می‌‌كنند. این واحد در معماری Sandy Bridge از نظر ساختار شباهت بسیاری به معماری NetBrust دارد. مهندسان اینتل یك‌بار دیگر به عقب برگشته و از رجیستر فایل درون پردازنده جدید خود استفاده كرده‌اند (اگر به خاطر داشته‌باشید، مهندسان اینتل این رجیستر فایل‌ها را در پردازنده‌های Nehalem و Core بازنشسته كردند). در گذشته زمانی‌كه Micro-Opsها بازآرایی می‌شدند، كپی كاملی از رجیسترها برای هر عملیات در رجیستر فایل‌ها ذخیره می‌‌شد. اما اكنون از مسیر (Link) به مقادیر رجیستری ذخیره‌شده در یك رجیستر فایل استفاده می‌‌شود. این رویكرد علاوه بر این‌كه موجب حذف انتقال داده‌های مفرط می‌شود، از تكرار محتویات رجیستر نیز جلوگیری می‌كند و موجب ذخیره فضا در رجیستر فایل می‌شود.

http://s4.picofile.com/file/7799941612/pic9.jpg

خوشه (Cluster) غیرترتیبی در پردازنده‌های Sandy Bridge می‌تواند در زمان یكسانی تا حداكثر 168 Micro-Ops نگه دارد، در حالی‌كه پردازنده‌های Nehalem قادر به ذخیره‌سازی تنها 128 Micro-Ops در ROBهای خود (Reorder Buffer)  بودند. این موضوع موجب كاهش مصرف انرژی می‌شود. به هر حال، جایگزین کردن روش مسیردهی به رجیستر فایل‌ها در عوض دسترسی به مقادیر واقعی آن‌ها اثرات منفی نیز به همراه دارد. این موضوع سبب شده تا مرحله جدیدی به خط لوله‌های اجرایی پردازنده اضافه می‌شود.
پردازنده‌های مبتنی بر Sandy Bridge از دستورالعمل‌های AVX جدید با رجیسترهای 256 بیتی پشتیبانی می‌کنند. دستورالعمل‌های AVX در حقیقت جزئی از پیشرفت SSE به شمار می‌آیند که در آن اندازه رجیسترهای SIMD رأس به 256 بیتی افزایش یافته‌است. در نتیجه، مجموعه دستورالعمل‌های AVX، مشابه پیشرفت ریزمعماری، می‌تواند موجب افزایش کارایی و کاهش توان مصرفی شود. زیرا اجرای این دستورالعمل اجازه خواهد داد تا بسیاری از الگوریتم‌ها ساده شده و از دستورالعمل‌های کمتری برای تکمیل وظایف استفاده شود. دستورالعمل‌های AVX برای محاسبات ممیز شناور سنگین در كاربردهای چندرسانه‌ا‌ی، علمی و مالی کاملاً مناسب است.
واحدهای اجرایی پردازنده برای این‌كه بتوانند دستورالعمل‌های 256 بیتی را به‌طور مؤثرتری اجرا كنند، باید دوباره طراحی ‌می‌شدند. اینتل در طراحی جدید، دو واحد اجرایی 128 بیتی با یكدیگر جفت كرده تا بتوانند بسته‌های اطلاعات 256 بیتی را به‌طور مؤثری پردازش كنند. از این رو، هر یك از سه پورت اجرایی در پردازنده‌های Sandy Bridge واحدهایی برای كار همزمان با سه نوع داده (64 بیت، 128 بیت عدد صحیح و 128 بیت عدد حقیقی) دارند. این موضوع موجب می‌شود، واحد‌های SIMD با یكدیگر درون یك پورت یكسان جفت شوند.

http://s4.picofile.com/file/7799942040/pic10.jpg

از آنجا كه Sandy Bridge برای كار با دستورالعمل‌های رأسی 256 بیتی طراحی شده‌است، اینتل باید به كارایی واحدهای اجرایی مسئول برای بارگذاری و تخلیه توجه ویژه‌ا‌ی می‌كرد. در پردازنده‌های Nehalem سه پورت برای این منظور طراحی شده‌بود كه اكنون نیز در Sandy Bridge این پورت‌ها موجود هستند. اما به منظور افزایش بهره‌وری این واحد‌ها، مهندسان اینتل، دو واحد از این سه واحد را كه برای ذخیره‌سازی آدرس‌ها و بارگذاری اطلاعات استفاده می‌شد با یكدیگر ادغام كرد‌ه‌اند. اكنون این دو واحد عملكرد یكسانی دارند و هر یك می‌توانند آدرس‌ها و داده‌ها را بارگذاری یا آدرس‌ها را تخلیه كنند. از این رو، هر پورت می‌تواند به واسطه عملكرد حداكثر شانزده بایت در هر سیكل، كل توان عملیاتی حافظه نهان سطح یك داده در معماری جدید را به میزان پنجاه درصد افزایش دهد. به عبارت دیگر، پردازنده‌های مبتنی بر معماری Sandy Bridge می‌تواند در هر سیكل 32 بایت داده از حافظه نهان سطح یك داده بارگذاری و شانزده بایت داده در آن ذخیره كنند.

http://s4.picofile.com/file/7799942468/pic11.jpg

اگر همه نوآوری‌های شرح داده شده در بالا را در كنار یكدیگر قرار دهیم، خواهیم دید، معماری هسته‌های محاسباتی در پردازنده‌های Sandy Bridge به‌طور چشمگیری اصلاح شده‌است. این تحولات آنقدر جدی هستند كه به سادگی بتوان گفت، پردازنده‌های جدید اینتل از یك معماری كاملاً متفاوت با پردازنده‌های Nehalem بهره می‌برد.

http://s4.picofile.com/file/7799942903/pic12.jpg

رویكرد جدید به سمت یكپارچه‌سازی
اینتل با معرفی معماری Nehalem شروع به گنجاندن اجزاء چیپ‌ست در  پردازنده كرد. در معماری Nehalem كنترلر حافظه، كنترلر رابط PCI Express و پردازنده‌گرافیكی، درون پردازنده گنجانده‌شد. به عبارت دیگر، با این تحولات، پردازنده‌ها دیگر تنها یك واحد اجرایی مركزی نیستند، بلكه مجموعه‌ا‌ی از واحد‌های پیچیده مختلف هستند.

http://s4.picofile.com/file/7799943973/pic13.jpg

گنجاندن این واحد‌ها درون پردازنده، موجب افزایش كارایی ناشی از كاهش زمان انتظار هنگام انتقال اطلاعات می‌شود. به هر حال، گنجاندن واحد‌های مختلف در پردازنده مشكلاتی را نیز به همراه دارد. یكی از مهم‌ترین موانع بر سر این راه، چگونگی اتصال این واحدها به یكدیگر به خصوص از نظر الكتریكی است. در این بین، اتصال حافظه نهان سطح سه اشتراكی با هسته‌های پردازنده‌ها یكی از سخت‌ترین كارها برای سازندگان است، به خصوص این‌كه تعداد هسته‌ها روز به روز افزایش پیدا می‌كند. به عبارت دیگر، زمانی كه مهندسان اینتل در حال كار روی معماری پردازنده‌های Sandy Bridge بودند، باید برای اتصال مناسب بین همه واحد‌های درون پردازنده فكر جدی می‌كردند. در معماری Nehalem و معماری‌های ماقبل، از اتصال Crossbar عمومی استفاده شده اما این اتصال برای پردازنده‌هایی با چندین واحد ‌متفاوت مناسب نیست.
مهندسان اینتل پیش از این در پردازنده‌های هشت هسته‌ا‌ی سرور Nehalem-EX برای متصل كردن هسته‌های محاسباتی به حافظه نهان سطح سه از فناوری جدیدی استفاده كرده‌اند. این فناوری Ring Bus نام دارد و اینتل اكنون در معماری Sandy Bridge نیز از آن استفاده كرده‌است. همه هسته‌‌های محاسباتی، حافظه نهان، پردازنده‌گرافیكی و عناصر پل‌جنوبی درون پردازنده جدید به باس حلقه (Ring Bus) متصل شده‌اند كه اجازه می‌دهد تعداد اتصالات درون هسته به میزان قابل توجهی كاهش پیدا كند.
مهندسان اینتل حافظه نهان سطح سه پردازنده‌های Sandy Bridge را به چهار بانك یكسان تقسیم كرده‌اند كه هر بانك دو مگابایت ظرفیت دارد. به عبارتی، تعداد این بانك‌ها دقیقاً یكسان با تعداد هسته‌های پردازنده است. این استراتژی اینتل به نظر می‌رسد بیشتر برای بازاریابی بود زیرا اینتل با جدا كردن این بانك‌ها می‌تواند پردازنده‌هایی با حافظه‌های نهان متفاوت و قیمت‌های مختلف تولید كند. به‌طور مثال، پردازنده‌‌ای ارزان‌قیمت با شش مگابایت حافظه نهان سطح سه به جای هشت مگابایت تولید كند. هر یك از بانك‌های حافظه نهان توسط «arbiter» خودشان اداره می‌شوند اما در زمان یكسان همه آن‌ها مشابه با یكدیگر كار می‌كنند و داده‌ها در آن‌ها هرگز تكراری نخواهدبود. استفاده از این بانك‌ها، موجب تقسیم حافظه نهان سطح سه نمی‌شود، بلكه تنها پهنای باند حافظه نهان سطح سه را افزایش می‌دهد. برای مثال، از آنجا كه «Ring» عرض 32 بیتی دارد، حداكثر پهنای باند حافظه نهان سطح سه درون یك پردازنده چهارهسته‌ا‌ی كه در فركانس 3/4 گیگاهرتز عمل می‌كند، برابر با 435/2 گیگابایت در ثانیه است. اینتل با این روش، به سادگی می‌تواند با افزایش تعداد هسته‌های پردازنده، تعداد بانك‌ها‌ی حافظه نهان سطح سه را نیز افزایش دهد.
از دیگر مزایای حافظه نهان سطح سه جدید می‌توان به كاهش زمان تأخیر آن اشاره كرد. اكنون زمان تأخیر حافظه نهان سطح سه بین 26 تا 31 سیكل است. این زمان در حافظه نهان سطح سه پردازنده‌های Nehalem بین 35 تا 40 سیكل بود. این توضیح لازم است كه تمامی حافظه‌های نهان در پردازنده‌های Sandy Bridge با فركانس پردازنده كار می‌كنند. به هر حال، این موضوع نیز سبب شده تا عملكرد حافظه نهان در این پردازنده‌‌ها سریع‌تر شود.
برتری دیگر باس حلقه این است كه از آن برای انتقال اطلاعات داده‌های مربوط به پردازنده‌گرافیكی كه درون پردازنده گنجانده شده‌است نیز استفاده می‌شود. این یعنی، پردازنده‌گرافیكی درون پردازنده، به‌طور مستقیم با حافظه در ارتباط نیست. این واحد شبیه هسته پردازنده با حافظه نهان سطح سه در ارتباط است. این موضوع سبب می‌شود، كارایی پردازنده‌گرافیكی به‌طور چشمگیری افزایش پیدا كند.

 پردازنده‌گرافیكی و ویژگی‌های جدید
گنجاندن پردازنده‌‌گرافیكی درون پردازنده موضوع جدیدی نیست. در حال حاضر، پردازنده‌های مبتنی بر هسته Clarkdale با پردازنده‌گرافیكی مجتمع‌شده Intel HD در بازار رایج هستند. در پردازنده‌های Sandy Bridge پردازنده‌گرافیكی و محاسباتی درون یك بسته‌بندی قرار گرفته‌اند و به باس حلقه یكسانی كه با دیگر منابع پردازنده مشترك است، متصل شده‌اند. بنابراین با توجه به این‌كه اكنون پردازنده‌گرافیكی به كنترلر حافظه نزدیك است و دسترسی مستقیمی به حافظه نهان سطح سه دارد، كارایی گرافیكی پردازنده‌های مبتنی بر Sandy Bridge افزایش پیدا كرده‌است. علاوه بر این، پردازنده‌گرافیكی نیز مانند هسته‌های محاسباتی پردازنده از بسیاری جهات پیشرفت كرده، به‌طوری كه برخی، این هسته را نسل جدید پردازنده‌‌گرافیكی اینتل می‌نامند. پردازنده‌گرافیكی اینتل هنوز شامل حداكثر دوازده واحد اجرایی (سایه‌زن) است و از رابط DirectX 10.1 پشتیبانی می‌كند. برخی پیش‌بینی كرده‌اند، پردازنده‌گرافیكی جدید اینتل تقریباً نسبت به گذشته دو برابر سریع‌تر عمل می‌كند.

http://s4.picofile.com/file/7799979779/pic14.jpg

از آنجا كه فرآیند ساخت پردازنده‌گرافیكی به 32 نانومتر كاهش یافته، بنابراین اینتل به سادگی توانسته فركانس پردازنده‌گرافیكی را افزایش دهد. فركانس این هسته در پردازنده‌های Core i7 برابر با 1/35 گیگاهرتز است كه برخی اعتقاد دارند، این فركانس می‌تواند به بیش از این مقدار نیز افزایش پیدا كند. اكنون كارایی پردازنده‌گرافیكی مجتمع Sandy Bridge با كارت‌های گرافیكی سطح پایین و ارزان‌قیمت قابل رقابت است. اینتل حتی قصد دارد در آینده از ویژگی FSAA (ضدپلگی تمام صفحه) در پردازنده‌‌گرافیكی خود پشتیبانی كند. با توجه به موارد ذكرشده، به نظر می‌رسد Sandy Bridge این شانس را داشته‌باشد كه عنوان بهترین پردازنده‌گرافیكی مجتمع را به دست آورد. این محصول حتی تهدید جدیدی برای كارت‌های گرافیك ارزان‌قیمت و سطح پایین نیز به شمار می‌آید. به هر حال، در همین ابتدای كار، NVIDIA و AMD شروع به تبلیغ منفی علیه این محصول كرده‌اند. آن‌ها اظهار می‌كنند، پردازنده‌گرافیكی اینتل فاقد پشتیبانی از DirectX نسخه 11 است. این موضوع سبب می‌شود، پردازنده‌گرافیكی اینتل قادر به اجرای بازی‌های مبتنی بر این نسخه از DirectX نباشد و همچنین در برنامه‌های كاربردی كه از DirectCompute استفاده می‌كنند، مانند مرورگرهای اینترنت آینده عملكرد نامناسبی خواهدداشت.
به هر حال، بهبود معماری پردازنده‌گرافیكی موجود، تنها چیزی نبوده كه در این بخش انجام شده‌است. پردازنده‌‌گرافیكی مجتمع در پردازنده‌های Sandy Bridge جدید به واحد جدید ویژه‌‌ای برای رمزگذاری و رمزگشایی ویدئویی در فرمت‌های مشهور مانند MPEG2 ،VC1 و AVC مجهز شده‌اند.
اگرچه رمزگشایی سخت‌افزاری فایل‌های ویدئویی این روزها موضوع جدیدی نیست و پردازنده‌گرافیكی Clarkdale نیز در سطح خوبی قادر به انجام این عملیات است. مسئولیت این وظیفه در هسته‌های قبلی بر عهده سایه‌زن‌ها بوده، در حالی كه در هسته جدید، واحد ویژه‌‌ای این مسئولیت را بر عهده دارد. این تغییرات برای پشتیبانی مناسب از ویدئویی سه‌بعدی موردنیاز بود، بنابراین پردازنده‌‌گرافیكی جدید می‌تواند به آسانی از عهده ویدئو سه‌بعدی به واسطه رمزگشایی سخت‌افزاری جریانات MVC و Blu-ray سه‌بعدی استریو برآید.
كدك (Codec) سخت‌افزاری یكی دیگر از ویژگی‌های قابل توجه پردازنده‌‌گرافیكی Sandy Bridge است. این كدك می‌تواند ویدئو‌های با  فرمت AVC را رمزگذاری كند. در عمل به این معنی است كه، پردازنده‌گرافیكی Sandy Bridge همه منابع موردنیاز برای رمزگشایی ویدئویی سریع را بدون نیاز به منابع پردازنده در اختیار دارد.

http://s4.picofile.com/file/7799980321/pic15.jpg

همه می‌دانیم كه عملكرد چندرسانه‌ای پردازنده‌های Sandy Bridge جدید توسط برنامه‌های كاربردی مشهوری همچون
ArcSoftMediaConverter ،Corel DVD Factory ،CyberLinkMediaEspresso،Roxio Creator و... پشتیبانی خواهدشد. در این روش، زمانی‌كه واحد‌های چندرسانه‌ای درون پردازنده‌گرافیكی Sandy Bridge برای كدگذاری ویدئویی استفاده می‌شوند، پردازنده‌های سایه‌زن آزاد باقی می‌مانند. بنابراین آن‌ها می‌توانند پردازش ویدئویی دیگری را انجام دهند که این موضوع باعث بهبود کارایی پردازنده‌گرافیکی می‌شود.
پردازنده‌های مبتنی بر معماری Sandy Bridge یكی از پردازنده‌‌های گرافیكی Intel HD 2000 یا Intel HD 3000 را خواهد داشت. این دو پردازنده‌گرافیکی از نظر تعداد واحد‌های اجرایی (سایه‌زن‌ها) با یكدیگر اختلاف دارند. پردازنده‌‌گرافیكی HD 3000 دارای دوازده واحد اجرایی و HD 2000 دارای شش واحد اجرایی است. همچنین فرکانس پردازنده‌گرافیکی HD 2000 کمی پایین‌تر از HD 3000 است. با این وجود، سخت‌افزار رمزگذاری و رمزگشایی در هر دو پردازنده‌گرافیکی یكسان است.


پل‌شمالی جدید- System Agent
پردازنده‌های Sandy Bridge جدید برای ارتباط با دیگر اجزای سیستم شامل همه كنترلر‌های خارجی مانند: رابط حافظه، صفحه‌نمایش، DMI و PCI Express از واحدی كه به اصطلاح System Agent نامیده می‌شود، استفاده می‌كنند. در حقیقت، System Agent خیلی شبیه واحد Uncore در پردازنده‌های Nehalem است. اما عملكرد System Agent دقیقاً مشابه با عملكرد Uncore نیست. اكنون System Agent شامل حافظه نهان سطح سه نیست و این حافظه ‌نهان یك واحد منحصر به‌فرد است كه با فركانس پردازنده عمل می‌كند، در حالی‌كه Uncore شامل حافظه نهان سطح سه بود و با فركانسی متمایز از فركانس پردازنده عمل می‌كرد. خصوصیت دیگری كه System Agent را از Uncore متمایز می‌كند، استفاده آن از باس حلقه برای تبادل اطلاعات بین پردازنده، پردازنده‌گرافیكی و حافظه نهان سطح سه است.

http://s4.picofile.com/file/7799980642/pic16.jpg

مهم‌ترین پیشرفت در System Agent مربوط به كنترلر حافظه می‌شود. كنترلر حافظه در پردازنده‌های (Westerme (Clarkdale با پردازنده‌گرافیكی تركیب شده‌بود كه این راه‌حل زیاد موفقیت‌آمیز نبود. اما سرانجام مهندسان اینتل این مسئله را در Sandy Bridge حل كردند. اكنون كنترلر حافظه در پردازنده‌های جدیدكارایی مشابه با كنترلر حافظه در پردازنده‌های Lynnfield دارد. توجه كنید كه این كنترلر از حافظه‌های DDR3 1066 یا DDR3 1333 پشتیبانی می‌كند. تصویر زیر، كارایی كنترلر حافظه در پردازنده‌های جدید را نشان می‌دهد.

http://s4.picofile.com/file/7799980856/pic17.jpg

زمان‌های تأخیر در معماری جدید دارای كاهش چشمگیری بوده و پهنای باند زیر سیستم حافظه نیز ارتقاء خوبی داشته‌است. كنترلر باس PCIE در Sandy Bridge شبیه پردازنده‌های LGA 1156 است. این كنترلر از شانزده مسیر PCI-Express نسخه دو پشتیبانی می‌كند كه این مسیرها می‌توانند به صورت یک رابط x16 یا دو رابط x8 پیكره‌بندی شوند.


واحد كنترلر توان
گذشته از كنترلرهای خارجی، بخش مهم دیگر System Agent واحد كنترلر توان (PCU) است. شبیه پردازنده‌های Nehalem این واحد یك میكروكنترلر قابل برنامه‌ریزی است كه اطلاعات مربوط به جریان و درجه حرارت بخش‌های مختلف پردازنده را جمع‌آوری می‌كند و می‌تواند ولتاژ‌ها و فركانس‌های آن‌ها را كنترل كند. PCU خصوصیات مربوط به ذخیره‌سازی توان و ویژگی Turbo Mode را بر عهده دارد.
به‌طور كلی، واحد‌های مختلف در معماری Sandy Bridge به سه بخش تقسیم شده‌اند كه هر بخش از الگوریتم فركانس و توان مخصوص به خود استفاده می‌كند. اولین بخش، شامل هسته‌های پردازنده و حافظه نهان سطح سه می‌شود كه در ولتاژ و فركانس یكسانی كار می‌كنند. دومین بخش، پردازنده‌گرافیكی است كه با فركانس مربوط به خودش عمل می‌كند و سومین بخش نیز، System Agent است.
این ساختار به مهندسان اینتل اجازه داده تا از فناوری ‌Enhanced Intel SpeedStep و Turbo Boost برای پردازنده‌‌های گرافیكی و هسته‌های پردازنده به‌طور جداگانه استفاده كنند. Sandy Bridge به‌طور سخت‌افزاری فركانس هسته پردازشی و گرافیك را با توجه به مصرف توانشان كنترل می‌كند. این سخت‌افزار موجب می‌شود، فركانس هسته‌های پردازنده‌ها به‌طور مؤثرتری در وضعیت Turbo Mode و زمانی كه پردازنده‌گرافیكی بیكار است، اوركلاك شود و برعکس پردازنده‌گرافیكی در زمانی كه هسته‌های پردازشی پردازنده به‌طور كامل استفاده نمی‌شوند، به میزان قابل توجه‌تری اوركلاك می‌شود.

http://s4.picofile.com/file/7799981498/pic18.jpg

فناوری Turbo Boost شامل تغییرات زیادی نشده تنها پیشرفتی كه در این بخش ایجاد شده، مربوط به PCU است. این واحد اكنون می‌تواند فركانس را به‌طور هوشمند‌تری كنترل كند و علاوه بر مدیریت توان مصرفی واحد‌های پردازنده، حرارت هر هسته را تحت‌نظر داشته‌باشد. با این ویژگی، اینتل به پردازنده‌های خود اجازه داده تا هنگامی كه در شرایط حرارتی مطلوبی قرار دارند، مصرف توانشان از حداكثر TDP مجاز تجاوز كند.
بار پردازنده در طی روز خیلی نامتقارن است، به‌طوری كه در بیشتر مواقع پردازنده در وضعیت ذخیره‌سازی توان قرار دارد و بندرت به كار خیلی سریع نیاز دارد. واحد PCU در پردازنده‌های Sandy Bridge كه فركانس‌ها را كنترل می‌كند، طوری طراحی شده كه در چنین مواقعی فركانس پردازنده را به میزان قابل توجهی افزایش ‌دهد و هنگامی كه درجه حرارت پردازنده به آستانه بحرانی رسید، فركانس را به سطح معقول كاهش دهد.

http://s4.picofile.com/file/7799982254/pic19.jpg

http://s4.picofile.com/file/7799982682/pic20.jpg

با توجه به این ویژگی پیشنهاد می‌شود، كاربران از سیستم خنك‌كنند‌گی مناسبی برای پردازنده‌های مبتنی بر Sandy Bridge استفاده كنند تا بتوانند حداكثر كارایی را از چنین پردازنده‌هایی به دست آورند. البته این توضیح لازم است كه اینتل محدودیتی نیز برای چنین وضعیتی در نظر گرفته‌است و  پردازنده‌های مبتنی بر Sandy Bridge تنها به مدت 25 ثانیه می‌توانند در این وضعیت عمل كنند.


نتیجه‌گیری
همان‌طور كه اشاره شد، معماری جدید اینتل شامل تعدادی نوآوری همچون پشتیبانی از دستورالعمل‌های 256 بیتی AVX، افزایش كارایی پردازنده‌گرافیكی، ماژول سخت‌افزاری برای رمزگذاری و رمزگشایی ویدئویی، حافظه نهان سطح سه جدید، باس حلقه، System Agent هوشمند، فناوری Turbo Boost پیشرفته‌تر و فركانس بالاتر شده‌است. برخی از این نو‌آوری‌ها تأثیر بسزایی روی كارایی خواهندداشت، به‌طوری كه پردازنده‌های مبتنی بر Sandy Bridge نسبت به پردازنده‌های نسل قبل سریع‌تر عمل می‌كنند.
یك پردازنده Sandy Bridge در قیمتی یكسان با یك پردازنده Clarkdale یا Lynnfield می‌تواند كارایی حداقل 25 درصد بالاتر در كاربردهای وابسته به پردازنده ارائه كند. به‌طور كلی، Sandy Bridge قادر است در برخی از كاربردها به واسطه ساختمان واحد‌های جدیدش كارایی حتی تا ده برابر بالاتر نسبت به پردازنده‌های نسل قبل خود ارائه كند. این افزایش كارایی به خصوص در برنامه‌های رمزگذاری/رمزگشایی ویدئویی به واسطه رمزگذار/رمزگشا سخت‌افزاری ویژه در پردازنده قابل مشاهده است. همچنین الگوریتم‌های مالی، علمی و چندرسانه‌ای روی پردازنده‌های جدید به واسطه دستورالعمل‌های AVX و AES-IN سریع‌تر اجرا خواهندشد. البته لازم است اشاره کنم، استفاده از این نو‌آوری‌ها منوط به پشتیبانی توسعه‌دهندگان نرم‌افزارها از این ویژگی‌های جدید پردازنده‌های اینتل در محصولاتشان است. این موضوع نیز زیاد جای نگرانی ندارد، با توجه به تدابیری كه مهندسان اینتل در نظر گرفته‌اند، به‌طور قطع، محصولات نرم‌افزاری متعددی مبتنی بر این ویژگی عرضه خواهدشد. پردازنده‌گرافیكی گنجانده‌شده در پردازنده‌های جدید نیز نسبت به نسل قبل بسیار سریع‌تر شده‌است كه این موضوع نیز برای كاربرانی كه قصد استفاده از گرافیك مجتمع دارند و همچنین كاربران كامپیوترهای همراه بسیار خوشایند خواهدبود.