همه چیز درباره سندی بریج
چرا Sandy Bridge؟
اجازه
دهید قبل از اینكه به بررسی جزئیات كامل معماری پردازندههای مبتنی بر
Sandy Bridge بپردازیم، این موضوع را بررسی کنیم كه چرا اینتل تصمیم به
تعویض معماری پردازندههایش گرفت. همانطور كه میدانید، پردازندههای
مبتنی بر معماری Nehalem، هم از كارایی بالایی برخوردار هستند، هم اینكه
مورد استقبال بازار واقع شدهاند. علاوه بر این، رقیب اصلی اینتل یعنی AMD
نیز نتوانسته محصولی ارائه كند كه رقیبی جدی برای پردازندههای اینتل به
شمار آید و بیشتر پردازندههای رایج این شركت از پردازندههای مبتنی بر
معماری Nehalem ضعیفتر هستند. اما دلیلی كه موجب شده تا اینتل معماری
جدیدی معرفی كند، نقایص معماری Nehalem است كه مهندسان اینتل را مجبور كرده
تا با وجود تمام مشكلاتی كه بر سر راه معرفی یك معماری جدید وجود دارد،
معماری جدیدی برای پردازندههای خود معرفی كنند. شاید از موارد زیر بتوان
بهعنوان ضعفهای معماری Nehalem نام برد.
اولین ضعفی که در این میان وجود دارد، این
است که آخرین نسل از پردازندههای مبتنی بر معماری Nehalem یعنی
پردازندههای مبتنی بر خانواده Westerme، فرآیند ساخت پیچیدهای داشتند.
آنها دارای دو هسته مجزا با دو فرآیند ساخت متفاوت بودند (هسته پردازنده
فرآیند ساخت 32 نانومتری داشت و پردازندهگرافیكی 45 نانومتری بود). دوم
اینکه، پردازندههای مبتنی بر معماری Nehalem به حداكثر میزان فركانس
رسیدهبودند یا به عبارت دیگر، اینتل با این معماری دیگر قادر به افزایش
فركانس پردازندههای خود نبود، بنابراین تنها روش برای افزایش كارایی
پردازنده، تغییر در ساختار معماری پردازنده بود.
مشخصات كلی
از دو سال
پیش تاكنون اینتل سعی كرده عملكردهای مربوط به چیپستها را به تدریج به
درون پردازنده انتقال دهد. در اولین پردازنده مبتنی بر معماری Nehalem
(یعنی Bloomfield) وظیفه كنترل حافظه از چیپست مادربورد به درون پردازنده
انتقال یافت. به عبارت دیگر، كنترلر حافظه به جای چیپست مادربورد در
پردازنده گنجانده شد. در خانواده بعدی پردازندههای اینتل یعنی Lynnfield،
علاوه بر كنترلر حافظه، كنترلر رابط PCI-Express نیز به درون پردازنده
منتقل شد. بعد از این موضوع، در پردازندههای Clarkdale، پردازندهگرافیكی
نیز در پردازندهمرکزی گنجانده شد. اگرچه این هسته بهطور مستقیم، داخل خود
هسته پردازنده گنجانده نشد اما به هرحال وظیفه پردازش گرافیكی سیستم، به
جای چیپستهای گرافیك مجتمع به پردازنده منتقل شد. اما اكنون در Sandy
Bridge همهچیز درون پردازنده گنجانده شدهاست. به عبارتی، در این معماری
هسته گرافیكی، كنترلر حافظه و كنترلر رابط PCI-Express درون هسته پردازنده
گنجانده شدهاند.
معماری Sandy Bridge از نظر مشخصات كلی تفاوت چندانی با نسل قبل
نداشتهاست. پردازندههای مبتنی بر این معماری 32 نانومتری هستند و مانند
پردازندههای نسل قبل، دو یا چهارهستهای خواهند بود كه از فناوری Hyper
Threading نیز پشتیبانی میكنند و دارای حداكثر هشت مگابایت حافظه نهان سطح
سه، كنترلر حافظه دوكاناله DDR3، كنترلر رابط PCI-Express نسخه دو با
پشتیبانی از شانزده مسیر و در نهایت، دارای یك واحد پردازشگرافیكی با
قابلیت پشتیبانی از رابط DirectX 10.1 هستند.
پیشرفتهای انجامشده در
معماری Sandy Bridge بیشتر در ریزمعماری و واحدهای اجرایی درون هسته است.
بهطوری كه ریزمعماری هستههای محاسباتی تغییرات جدی داشته و این موضوع
موجب شده تا پردازندههای جدید بهطور قابل توجهی سریعتر از پردازندههای
نسل قبل در فركانس یكسان عمل كنند. مهندسان اینتل همچنین برای كاهش حرارت
پردازنده، كارهای متعددی انجام دادهاند، بنابراین پردازندههای مبتنی بر
Sandy Bridge قادر خواهند بود به سادگی در ضریب كلاكهای بالاتر عمل كنند.
علاوه بر این، پردازندههای جدید از دستورالعملهای AVX يا Advanced
Vector Extension جدیدی نیز پشتیبانی میكنند كه برای تعدادی از
الگوریتمهای چندرسانهای، مالی یا علمی موردنیاز خواهدبود. AVX با مجموعه
دستورالعملهای قبل SSE تفاوت دارد. این دستورالعملها دارای عرض باند
بالاتری هستند (265 بیت به جای 128 بیت) و بنابراین اجازه خواهند داد،
میزان دادههای وسیعتری پردازش شوند. در ادامه مقاله، به بررسی جزئیات
تحولات انجامشده در معماری جدید خواهیم پرداخت.
اینتل انتظار دارد، پردازندههای مبتنی بر Sandy Bridge به سرعت مورد استقبال بیشتر خریداران قرار گیرد. آنها قصد دارند، گستره وسیعی از پردازندههای Core i5 ،Core i3 و Core i7 مبتنی بر این معماری جدید را با قیمتی بین صد تا سیصد دلار در همین آغاز كار به بازار عرضه كنند و در انتهای سال 2011 نیز قصد دارند، پردازندههای گرانقیمتتر مبتنی بر این معماری عرضه كنند.
پردازندههای معرفیشده در تصویر بالا، برای كامپیوترهای خانگی هستند اما پردازندههای 65 و 45 واتی تصویر زیر برای كامپیوترهای همراه در نظر گرفته شدهاند.
این پردازندها در حقیقت جایگزین پردازندهای مبتنی بر سوكت 1156 خواهندشد و
اینتل قصد ندارد تا اواخر سال 2011 میلادی جایگزینی برای پردازندههای
مبتنی بر سوكت 1366 معرفی كند. اینتل در حقیقت قصد دارد پردازندههای
حرفهای مبتنی بر معماری Sandy Bridge را در اواخر سال 2011 میلادی معرفی
كند. این پردازندهها مبتنی بر سوكت 2011 خواهندبود و دارای هشت هسته
پردازشی، شانزده مگابایت حافظه نهان سطح سه، كنترلكننده حافظه چهاركاناله،
32 مسیر PCI Express نسخه سه و به احتمال چند فناوری جذاب دیگر هستند.
پردازندههای
مبتنی بر Sandy Bridge با سوكت 1155 سازگار هستند و این سوكت با
پردازندههای مبتنی بر معماری Nehalem سوكت 1156 سازگاری ندارد. اینتل
همچنین برای این نسل از پردازندهای خود چیپستهای جدید معرفی كردهاست.
با توجه به اینكه تمامی وظایف مرتبط با پلشمالی به پردازنده محول شده،
چیپستهای P67 و H67 بسیار ساده هستند. این چیپستها مانند نسل قبل
تكچیپست هستند اما تفاوت عمده آنها نسبت به چیپستهای نسل قبل پشتیبانی
از دو پورت SATA نسخه سه و عدم پشتیبانی از رابطهای PCI سنتی است.
متأسفانه این چیپستهای جدید مشابه نسل ماقبل خود فاقد قابلیت پشتیبانی از
پورت USB 3.0 هستند.
افزایش كارایی از چه روشی؟
شركت اینتل در معماری Sandy
Bridge چندین تغییر غیرمنتظره ایجاد كرده كه به موجب آن كارایی پردازنده
افزایش و در مقابل مصرف توان و درجه حرارت آن كاهش پیدا كردهاست. در
حقیقت، Sandy Bridge معماری توسعهیافته Nehalem نیست، بلكه این معماری
تركیبی از معماری Nehalem با پروژه به ظاهر شكستخورده پنتیوم 4 است. بله؛
درست متوجه شدهاید، اگرچه معماری NetBurst شركت اینتل مدت زمان زیادی است
كه به دلیل مصرف توان ناكارآمد منسوخ شده اما اكنون از برخی واحدهای
پردازندههای پنتیوم 4 در پردازندههای Core i5 ،Core i3 و Core i7 جدید
استفاده شدهاست. شاید شنیدن این نكته جالب باشد كه اینتل عنوان كرده،
اقتباس برخی از بخشها از پنتیوم 4 فقط برای افزایش كارایی نبوده بلكه
بیشتر برای كاهش مصرف توان بودهاست.
تغییرات انجامشده در معماری Sandy
Bridge را با بررسی خط لولهها آغاز میكنیم. در ابتدای خط لولهها،
رمزگشاها قرار دارند كه همچون گذشته دستورالعملهای x86 را به Micro-ops
سادهتر رمزگشایی میكنند. رمزگشاها در معماری جدید مشابه با Nehalem در هر
سیكل چهار دستورالعمل پردازش میكنند و مانند گذشته از فناوری
Micro-Fusion و Macro Fusion نیز پشتیبانی میكنند. اما در معماری جدید،
دستورالعملهای رمزگشاییشده به Micro-Opsها به جای اینکه به مرحله بعدی
پردازش بروند، ذخیره میشوند. در حقیقت، Sandy Bridge یك حافظه سطح صفر
اضافی برای ذخیره نتایج رمزگشایی دارد. این حافظه نهان اولین بخشی است كه
از معماری NetBurst برگرفته شدهاست. عملكرد كلی این حافظه نهان مشابه
Execution Trace Cache است كه در پردازندههای پنیتوم 4 بهكار گرفته
شدهبود.
حافظه نهان Micro-Opsهای رمزگشاییشده حدود شش كیلوبایت است كه میتواند
حداكثر یکهزار و پانصد Micro-Ops در خود ذخیره كند. اكنون اگر رمزگشا
دستورالعملی دریافت كند كه قبلاً ترجمه كرده و در حافظه نهان نیز ذخیره
شده، دوباره آن دستورالعمل را رمزگشایی نمیكند و از Micro-Ops مربوط به آن
دستورالعمل كه در حافظه نهان Micro-Ops ذخیره شده، استفاده میكند.
بنابراین حافظه نهان Micro Opsهای رمزگشاییشده به حذف بار اضافی از
رمزگشاها كمك میكند و همچنین موجب كاهش مصرف انرزی پردازنده میشود. بنابر
گفته مهندسان اینتل در هشتاد درصد مواقع دسترسی به این حافظه نهان اضافی
موردنیاز است. گذشته از این، زمانی كه رمزگشاها در معماری Sandy Bridge
بیكار هستند، غیرفعال میشوند كه این موضوع به كاهش مصرف توان پردازنده
كمك میكند.
دومین پیشرفت مهم در خط لولهها مربوط به واحد پیشبینی
انشعاب است. این واحد از اهمیت بسزایی در پردازندهها برخوردار است زیرا هر
پیشبینی انشعاب نادرست نیازمند توقف و تخلیه خط لولهها بهطور كامل است.
در نتیجه، یك پیشبینی اشتباه نه تنها روی كارایی اثر منفی دارد، بلكه
موجب افزایش توان مصرفی برای پر كردن دوباره خط لوله میشود. اینتل به این
واحد در پردازندههای جدید توجه ویژهای كرده تا آنها بهطور موثرتری عمل
كنند. این شركت همه بافرهای Sandy Bridge را كه برای ذخیره آدرسهای
انشعابها و تاریخچه پیشبینی بهكار گرفته شده، به منظور افزایش حجم
ذخیرهسازی در آنها اصلاح كردهاست. در نتیجه Sandy Bridge اكنون قادر است
تاریخچه پیشبینی انشعابهای طولانیتری ذخیره كند. این موضوع تأثیر زیادی
روی كارایی واحد پیشبینی انشعاب میگذارد. مطابق برآوردهای اولیه، درستی
پیشبینی انشعاب در Sandy Bridge به بیش از پنج درصد در مقایسه با نسل قبل
بهبود پیدا كردهاست.
همانطور كه گفته شد، واحد پیشبینی انشعاب در پردازندههای غیرترتیبی از اهمیت بالایی برخوردار است و اغلب، سازندگان با معرفی یك معماری جدید تغییراتی در این واحد اعمال میكنند. این واحد در معماری Sandy Bridge از نظر ساختار شباهت بسیاری به معماری NetBrust دارد. مهندسان اینتل یكبار دیگر به عقب برگشته و از رجیستر فایل درون پردازنده جدید خود استفاده كردهاند (اگر به خاطر داشتهباشید، مهندسان اینتل این رجیستر فایلها را در پردازندههای Nehalem و Core بازنشسته كردند). در گذشته زمانیكه Micro-Opsها بازآرایی میشدند، كپی كاملی از رجیسترها برای هر عملیات در رجیستر فایلها ذخیره میشد. اما اكنون از مسیر (Link) به مقادیر رجیستری ذخیرهشده در یك رجیستر فایل استفاده میشود. این رویكرد علاوه بر اینكه موجب حذف انتقال دادههای مفرط میشود، از تكرار محتویات رجیستر نیز جلوگیری میكند و موجب ذخیره فضا در رجیستر فایل میشود.
خوشه (Cluster) غیرترتیبی در پردازندههای Sandy Bridge میتواند در زمان
یكسانی تا حداكثر 168 Micro-Ops نگه دارد، در حالیكه پردازندههای Nehalem
قادر به ذخیرهسازی تنها 128 Micro-Ops در ROBهای خود (Reorder Buffer)
بودند. این موضوع موجب كاهش مصرف انرژی میشود. به هر حال، جایگزین کردن
روش مسیردهی به رجیستر فایلها در عوض دسترسی به مقادیر واقعی آنها اثرات
منفی نیز به همراه دارد. این موضوع سبب شده تا مرحله جدیدی به خط لولههای
اجرایی پردازنده اضافه میشود.
پردازندههای مبتنی بر Sandy Bridge از
دستورالعملهای AVX جدید با رجیسترهای 256 بیتی پشتیبانی میکنند.
دستورالعملهای AVX در حقیقت جزئی از پیشرفت SSE به شمار میآیند که در آن
اندازه رجیسترهای SIMD رأس به 256 بیتی افزایش یافتهاست. در نتیجه، مجموعه
دستورالعملهای AVX، مشابه پیشرفت ریزمعماری، میتواند موجب افزایش کارایی
و کاهش توان مصرفی شود. زیرا اجرای این دستورالعمل اجازه خواهد داد تا
بسیاری از الگوریتمها ساده شده و از دستورالعملهای کمتری برای تکمیل
وظایف استفاده شود. دستورالعملهای AVX برای محاسبات ممیز شناور سنگین در
كاربردهای چندرسانهای، علمی و مالی کاملاً مناسب است.
واحدهای اجرایی
پردازنده برای اینكه بتوانند دستورالعملهای 256 بیتی را بهطور مؤثرتری
اجرا كنند، باید دوباره طراحی میشدند. اینتل در طراحی جدید، دو واحد
اجرایی 128 بیتی با یكدیگر جفت كرده تا بتوانند بستههای اطلاعات 256 بیتی
را بهطور مؤثری پردازش كنند. از این رو، هر یك از سه پورت اجرایی در
پردازندههای Sandy Bridge واحدهایی برای كار همزمان با سه نوع داده (64
بیت، 128 بیت عدد صحیح و 128 بیت عدد حقیقی) دارند. این موضوع موجب میشود،
واحدهای SIMD با یكدیگر درون یك پورت یكسان جفت شوند.
از آنجا كه Sandy Bridge برای كار با دستورالعملهای رأسی 256 بیتی طراحی شدهاست، اینتل باید به كارایی واحدهای اجرایی مسئول برای بارگذاری و تخلیه توجه ویژهای میكرد. در پردازندههای Nehalem سه پورت برای این منظور طراحی شدهبود كه اكنون نیز در Sandy Bridge این پورتها موجود هستند. اما به منظور افزایش بهرهوری این واحدها، مهندسان اینتل، دو واحد از این سه واحد را كه برای ذخیرهسازی آدرسها و بارگذاری اطلاعات استفاده میشد با یكدیگر ادغام كردهاند. اكنون این دو واحد عملكرد یكسانی دارند و هر یك میتوانند آدرسها و دادهها را بارگذاری یا آدرسها را تخلیه كنند. از این رو، هر پورت میتواند به واسطه عملكرد حداكثر شانزده بایت در هر سیكل، كل توان عملیاتی حافظه نهان سطح یك داده در معماری جدید را به میزان پنجاه درصد افزایش دهد. به عبارت دیگر، پردازندههای مبتنی بر معماری Sandy Bridge میتواند در هر سیكل 32 بایت داده از حافظه نهان سطح یك داده بارگذاری و شانزده بایت داده در آن ذخیره كنند.
اگر همه نوآوریهای شرح داده شده در بالا را در كنار یكدیگر قرار دهیم، خواهیم دید، معماری هستههای محاسباتی در پردازندههای Sandy Bridge بهطور چشمگیری اصلاح شدهاست. این تحولات آنقدر جدی هستند كه به سادگی بتوان گفت، پردازندههای جدید اینتل از یك معماری كاملاً متفاوت با پردازندههای Nehalem بهره میبرد.
رویكرد جدید به سمت یكپارچهسازی
اینتل با معرفی
معماری Nehalem شروع به گنجاندن اجزاء چیپست در پردازنده كرد. در معماری
Nehalem كنترلر حافظه، كنترلر رابط PCI Express و پردازندهگرافیكی، درون
پردازنده گنجاندهشد. به عبارت دیگر، با این تحولات، پردازندهها دیگر تنها
یك واحد اجرایی مركزی نیستند، بلكه مجموعهای از واحدهای پیچیده مختلف
هستند.
گنجاندن این واحدها درون پردازنده، موجب
افزایش كارایی ناشی از كاهش زمان انتظار هنگام انتقال اطلاعات میشود. به
هر حال، گنجاندن واحدهای مختلف در پردازنده مشكلاتی را نیز به همراه دارد.
یكی از مهمترین موانع بر سر این راه، چگونگی اتصال این واحدها به یكدیگر
به خصوص از نظر الكتریكی است. در این بین، اتصال حافظه نهان سطح سه اشتراكی
با هستههای پردازندهها یكی از سختترین كارها برای سازندگان است، به
خصوص اینكه تعداد هستهها روز به روز افزایش پیدا میكند. به عبارت دیگر،
زمانی كه مهندسان اینتل در حال كار روی معماری پردازندههای Sandy Bridge
بودند، باید برای اتصال مناسب بین همه واحدهای درون پردازنده فكر جدی
میكردند. در معماری Nehalem و معماریهای ماقبل، از اتصال Crossbar عمومی
استفاده شده اما این اتصال برای پردازندههایی با چندین واحد متفاوت مناسب
نیست.
مهندسان اینتل پیش از این در پردازندههای هشت هستهای سرور
Nehalem-EX برای متصل كردن هستههای محاسباتی به حافظه نهان سطح سه از
فناوری جدیدی استفاده كردهاند. این فناوری Ring Bus نام دارد و اینتل
اكنون در معماری Sandy Bridge نیز از آن استفاده كردهاست. همه هستههای
محاسباتی، حافظه نهان، پردازندهگرافیكی و عناصر پلجنوبی درون پردازنده
جدید به باس حلقه (Ring Bus) متصل شدهاند كه اجازه میدهد تعداد اتصالات
درون هسته به میزان قابل توجهی كاهش پیدا كند.
مهندسان اینتل حافظه
نهان سطح سه پردازندههای Sandy Bridge را به چهار بانك یكسان تقسیم
كردهاند كه هر بانك دو مگابایت ظرفیت دارد. به عبارتی، تعداد این بانكها
دقیقاً یكسان با تعداد هستههای پردازنده است. این استراتژی اینتل به نظر
میرسد بیشتر برای بازاریابی بود زیرا اینتل با جدا كردن این بانكها
میتواند پردازندههایی با حافظههای نهان متفاوت و قیمتهای مختلف تولید
كند. بهطور مثال، پردازندهای ارزانقیمت با شش مگابایت حافظه نهان سطح
سه به جای هشت مگابایت تولید كند. هر یك از بانكهای حافظه نهان توسط
«arbiter» خودشان اداره میشوند اما در زمان یكسان همه آنها مشابه با
یكدیگر كار میكنند و دادهها در آنها هرگز تكراری نخواهدبود. استفاده از
این بانكها، موجب تقسیم حافظه نهان سطح سه نمیشود، بلكه تنها پهنای باند
حافظه نهان سطح سه را افزایش میدهد. برای مثال، از آنجا كه «Ring» عرض 32
بیتی دارد، حداكثر پهنای باند حافظه نهان سطح سه درون یك پردازنده
چهارهستهای كه در فركانس 3/4 گیگاهرتز عمل میكند، برابر با 435/2
گیگابایت در ثانیه است. اینتل با این روش، به سادگی میتواند با افزایش
تعداد هستههای پردازنده، تعداد بانكهای حافظه نهان سطح سه را نیز افزایش
دهد.
از دیگر مزایای حافظه نهان سطح سه جدید میتوان به كاهش زمان
تأخیر آن اشاره كرد. اكنون زمان تأخیر حافظه نهان سطح سه بین 26 تا 31 سیكل
است. این زمان در حافظه نهان سطح سه پردازندههای Nehalem بین 35 تا 40
سیكل بود. این توضیح لازم است كه تمامی حافظههای نهان در پردازندههای
Sandy Bridge با فركانس پردازنده كار میكنند. به هر حال، این موضوع نیز
سبب شده تا عملكرد حافظه نهان در این پردازندهها سریعتر شود.
برتری
دیگر باس حلقه این است كه از آن برای انتقال اطلاعات دادههای مربوط به
پردازندهگرافیكی كه درون پردازنده گنجانده شدهاست نیز استفاده میشود.
این یعنی، پردازندهگرافیكی درون پردازنده، بهطور مستقیم با حافظه در
ارتباط نیست. این واحد شبیه هسته پردازنده با حافظه نهان سطح سه در ارتباط
است. این موضوع سبب میشود، كارایی پردازندهگرافیكی بهطور چشمگیری افزایش
پیدا كند.
پردازندهگرافیكی و ویژگیهای جدید
گنجاندن
پردازندهگرافیكی درون پردازنده موضوع جدیدی نیست. در حال حاضر،
پردازندههای مبتنی بر هسته Clarkdale با پردازندهگرافیكی مجتمعشده Intel
HD در بازار رایج هستند. در پردازندههای Sandy Bridge پردازندهگرافیكی و
محاسباتی درون یك بستهبندی قرار گرفتهاند و به باس حلقه یكسانی كه با
دیگر منابع پردازنده مشترك است، متصل شدهاند. بنابراین با توجه به اینكه
اكنون پردازندهگرافیكی به كنترلر حافظه نزدیك است و دسترسی مستقیمی به
حافظه نهان سطح سه دارد، كارایی گرافیكی پردازندههای مبتنی بر Sandy
Bridge افزایش پیدا كردهاست. علاوه بر این، پردازندهگرافیكی نیز مانند
هستههای محاسباتی پردازنده از بسیاری جهات پیشرفت كرده، بهطوری كه برخی،
این هسته را نسل جدید پردازندهگرافیكی اینتل مینامند. پردازندهگرافیكی
اینتل هنوز شامل حداكثر دوازده واحد اجرایی (سایهزن) است و از رابط
DirectX 10.1 پشتیبانی میكند. برخی پیشبینی كردهاند، پردازندهگرافیكی
جدید اینتل تقریباً نسبت به گذشته دو برابر سریعتر عمل میكند.
از آنجا كه فرآیند ساخت پردازندهگرافیكی به 32 نانومتر كاهش یافته،
بنابراین اینتل به سادگی توانسته فركانس پردازندهگرافیكی را افزایش دهد.
فركانس این هسته در پردازندههای Core i7 برابر با 1/35 گیگاهرتز است كه
برخی اعتقاد دارند، این فركانس میتواند به بیش از این مقدار نیز افزایش
پیدا كند. اكنون كارایی پردازندهگرافیكی مجتمع Sandy Bridge با كارتهای
گرافیكی سطح پایین و ارزانقیمت قابل رقابت است. اینتل حتی قصد دارد در
آینده از ویژگی FSAA (ضدپلگی تمام صفحه) در پردازندهگرافیكی خود پشتیبانی
كند. با توجه به موارد ذكرشده، به نظر میرسد Sandy Bridge این شانس را
داشتهباشد كه عنوان بهترین پردازندهگرافیكی مجتمع را به دست آورد. این
محصول حتی تهدید جدیدی برای كارتهای گرافیك ارزانقیمت و سطح پایین نیز به
شمار میآید. به هر حال، در همین ابتدای كار، NVIDIA و AMD شروع به تبلیغ
منفی علیه این محصول كردهاند. آنها اظهار میكنند، پردازندهگرافیكی
اینتل فاقد پشتیبانی از DirectX نسخه 11 است. این موضوع سبب میشود،
پردازندهگرافیكی اینتل قادر به اجرای بازیهای مبتنی بر این نسخه از
DirectX نباشد و همچنین در برنامههای كاربردی كه از DirectCompute استفاده
میكنند، مانند مرورگرهای اینترنت آینده عملكرد نامناسبی خواهدداشت.
به
هر حال، بهبود معماری پردازندهگرافیكی موجود، تنها چیزی نبوده كه در این
بخش انجام شدهاست. پردازندهگرافیكی مجتمع در پردازندههای Sandy Bridge
جدید به واحد جدید ویژهای برای رمزگذاری و رمزگشایی ویدئویی در فرمتهای
مشهور مانند MPEG2 ،VC1 و AVC مجهز شدهاند.
اگرچه رمزگشایی سختافزاری
فایلهای ویدئویی این روزها موضوع جدیدی نیست و پردازندهگرافیكی Clarkdale
نیز در سطح خوبی قادر به انجام این عملیات است. مسئولیت این وظیفه در
هستههای قبلی بر عهده سایهزنها بوده، در حالی كه در هسته جدید، واحد
ویژهای این مسئولیت را بر عهده دارد. این تغییرات برای پشتیبانی مناسب از
ویدئویی سهبعدی موردنیاز بود، بنابراین پردازندهگرافیكی جدید میتواند
به آسانی از عهده ویدئو سهبعدی به واسطه رمزگشایی سختافزاری جریانات MVC و
Blu-ray سهبعدی استریو برآید.
كدك (Codec) سختافزاری یكی دیگر از
ویژگیهای قابل توجه پردازندهگرافیكی Sandy Bridge است. این كدك میتواند
ویدئوهای با فرمت AVC را رمزگذاری كند. در عمل به این معنی است كه،
پردازندهگرافیكی Sandy Bridge همه منابع موردنیاز برای رمزگشایی ویدئویی
سریع را بدون نیاز به منابع پردازنده در اختیار دارد.
همه میدانیم كه عملكرد چندرسانهای پردازندههای Sandy Bridge جدید توسط برنامههای كاربردی مشهوری همچون
ArcSoftMediaConverter ،Corel DVD Factory ،CyberLinkMediaEspresso،Roxio
Creator و... پشتیبانی خواهدشد. در این روش، زمانیكه واحدهای چندرسانهای
درون پردازندهگرافیكی Sandy Bridge برای كدگذاری ویدئویی استفاده
میشوند، پردازندههای سایهزن آزاد باقی میمانند. بنابراین آنها
میتوانند پردازش ویدئویی دیگری را انجام دهند که این موضوع باعث بهبود
کارایی پردازندهگرافیکی میشود.
پردازندههای مبتنی بر معماری Sandy
Bridge یكی از پردازندههای گرافیكی Intel HD 2000 یا Intel HD 3000 را
خواهد داشت. این دو پردازندهگرافیکی از نظر تعداد واحدهای اجرایی
(سایهزنها) با یكدیگر اختلاف دارند. پردازندهگرافیكی HD 3000 دارای
دوازده واحد اجرایی و HD 2000 دارای شش واحد اجرایی است. همچنین فرکانس
پردازندهگرافیکی HD 2000 کمی پایینتر از HD 3000 است. با این وجود،
سختافزار رمزگذاری و رمزگشایی در هر دو پردازندهگرافیکی یكسان است.
پلشمالی جدید- System Agent
پردازندههای
Sandy Bridge جدید برای ارتباط با دیگر اجزای سیستم شامل همه كنترلرهای
خارجی مانند: رابط حافظه، صفحهنمایش، DMI و PCI Express از واحدی كه به
اصطلاح System Agent نامیده میشود، استفاده میكنند. در حقیقت، System
Agent خیلی شبیه واحد Uncore در پردازندههای Nehalem است. اما عملكرد
System Agent دقیقاً مشابه با عملكرد Uncore نیست. اكنون System Agent شامل
حافظه نهان سطح سه نیست و این حافظه نهان یك واحد منحصر بهفرد است كه با
فركانس پردازنده عمل میكند، در حالیكه Uncore شامل حافظه نهان سطح سه
بود و با فركانسی متمایز از فركانس پردازنده عمل میكرد. خصوصیت دیگری كه
System Agent را از Uncore متمایز میكند، استفاده آن از باس حلقه برای
تبادل اطلاعات بین پردازنده، پردازندهگرافیكی و حافظه نهان سطح سه است.
مهمترین پیشرفت در System Agent مربوط به كنترلر حافظه میشود. كنترلر حافظه در پردازندههای (Westerme (Clarkdale با پردازندهگرافیكی تركیب شدهبود كه این راهحل زیاد موفقیتآمیز نبود. اما سرانجام مهندسان اینتل این مسئله را در Sandy Bridge حل كردند. اكنون كنترلر حافظه در پردازندههای جدیدكارایی مشابه با كنترلر حافظه در پردازندههای Lynnfield دارد. توجه كنید كه این كنترلر از حافظههای DDR3 1066 یا DDR3 1333 پشتیبانی میكند. تصویر زیر، كارایی كنترلر حافظه در پردازندههای جدید را نشان میدهد.
زمانهای تأخیر در معماری جدید دارای كاهش چشمگیری بوده و پهنای باند زیر سیستم حافظه نیز ارتقاء خوبی داشتهاست. كنترلر باس PCIE در Sandy Bridge شبیه پردازندههای LGA 1156 است. این كنترلر از شانزده مسیر PCI-Express نسخه دو پشتیبانی میكند كه این مسیرها میتوانند به صورت یک رابط x16 یا دو رابط x8 پیكرهبندی شوند.
واحد كنترلر توان
گذشته
از كنترلرهای خارجی، بخش مهم دیگر System Agent واحد كنترلر توان (PCU)
است. شبیه پردازندههای Nehalem این واحد یك میكروكنترلر قابل برنامهریزی
است كه اطلاعات مربوط به جریان و درجه حرارت بخشهای مختلف پردازنده را
جمعآوری میكند و میتواند ولتاژها و فركانسهای آنها را كنترل كند. PCU
خصوصیات مربوط به ذخیرهسازی توان و ویژگی Turbo Mode را بر عهده دارد.
بهطور
كلی، واحدهای مختلف در معماری Sandy Bridge به سه بخش تقسیم شدهاند كه
هر بخش از الگوریتم فركانس و توان مخصوص به خود استفاده میكند. اولین بخش،
شامل هستههای پردازنده و حافظه نهان سطح سه میشود كه در ولتاژ و فركانس
یكسانی كار میكنند. دومین بخش، پردازندهگرافیكی است كه با فركانس مربوط
به خودش عمل میكند و سومین بخش نیز، System Agent است.
این ساختار به
مهندسان اینتل اجازه داده تا از فناوری Enhanced Intel SpeedStep و Turbo
Boost برای پردازندههای گرافیكی و هستههای پردازنده بهطور جداگانه
استفاده كنند. Sandy Bridge بهطور سختافزاری فركانس هسته پردازشی و
گرافیك را با توجه به مصرف توانشان كنترل میكند. این سختافزار موجب
میشود، فركانس هستههای پردازندهها بهطور مؤثرتری در وضعیت Turbo Mode و
زمانی كه پردازندهگرافیكی بیكار است، اوركلاك شود و برعکس
پردازندهگرافیكی در زمانی كه هستههای پردازشی پردازنده بهطور كامل
استفاده نمیشوند، به میزان قابل توجهتری اوركلاك میشود.
فناوری Turbo Boost شامل تغییرات زیادی نشده تنها پیشرفتی كه در این بخش
ایجاد شده، مربوط به PCU است. این واحد اكنون میتواند فركانس را بهطور
هوشمندتری كنترل كند و علاوه بر مدیریت توان مصرفی واحدهای پردازنده،
حرارت هر هسته را تحتنظر داشتهباشد. با این ویژگی، اینتل به پردازندههای
خود اجازه داده تا هنگامی كه در شرایط حرارتی مطلوبی قرار دارند، مصرف
توانشان از حداكثر TDP مجاز تجاوز كند.
بار پردازنده در طی روز خیلی
نامتقارن است، بهطوری كه در بیشتر مواقع پردازنده در وضعیت ذخیرهسازی
توان قرار دارد و بندرت به كار خیلی سریع نیاز دارد. واحد PCU در
پردازندههای Sandy Bridge كه فركانسها را كنترل میكند، طوری طراحی شده
كه در چنین مواقعی فركانس پردازنده را به میزان قابل توجهی افزایش دهد و
هنگامی كه درجه حرارت پردازنده به آستانه بحرانی رسید، فركانس را به سطح
معقول كاهش دهد.
با توجه به این ویژگی پیشنهاد میشود، كاربران از سیستم خنككنندگی مناسبی برای پردازندههای مبتنی بر Sandy Bridge استفاده كنند تا بتوانند حداكثر كارایی را از چنین پردازندههایی به دست آورند. البته این توضیح لازم است كه اینتل محدودیتی نیز برای چنین وضعیتی در نظر گرفتهاست و پردازندههای مبتنی بر Sandy Bridge تنها به مدت 25 ثانیه میتوانند در این وضعیت عمل كنند.
نتیجهگیری
همانطور
كه اشاره شد، معماری جدید اینتل شامل تعدادی نوآوری همچون پشتیبانی از
دستورالعملهای 256 بیتی AVX، افزایش كارایی پردازندهگرافیكی، ماژول
سختافزاری برای رمزگذاری و رمزگشایی ویدئویی، حافظه نهان سطح سه جدید، باس
حلقه، System Agent هوشمند، فناوری Turbo Boost پیشرفتهتر و فركانس
بالاتر شدهاست. برخی از این نوآوریها تأثیر بسزایی روی كارایی
خواهندداشت، بهطوری كه پردازندههای مبتنی بر Sandy Bridge نسبت به
پردازندههای نسل قبل سریعتر عمل میكنند.
یك پردازنده Sandy Bridge
در قیمتی یكسان با یك پردازنده Clarkdale یا Lynnfield میتواند كارایی
حداقل 25 درصد بالاتر در كاربردهای وابسته به پردازنده ارائه كند. بهطور
كلی، Sandy Bridge قادر است در برخی از كاربردها به واسطه ساختمان واحدهای
جدیدش كارایی حتی تا ده برابر بالاتر نسبت به پردازندههای نسل قبل خود
ارائه كند. این افزایش كارایی به خصوص در برنامههای رمزگذاری/رمزگشایی
ویدئویی به واسطه رمزگذار/رمزگشا سختافزاری ویژه در پردازنده قابل مشاهده
است. همچنین الگوریتمهای مالی، علمی و چندرسانهای روی پردازندههای جدید
به واسطه دستورالعملهای AVX و AES-IN سریعتر اجرا خواهندشد. البته لازم
است اشاره کنم، استفاده از این نوآوریها منوط به پشتیبانی توسعهدهندگان
نرمافزارها از این ویژگیهای جدید پردازندههای اینتل در محصولاتشان است.
این موضوع نیز زیاد جای نگرانی ندارد، با توجه به تدابیری كه مهندسان اینتل
در نظر گرفتهاند، بهطور قطع، محصولات نرمافزاری متعددی مبتنی بر این
ویژگی عرضه خواهدشد. پردازندهگرافیكی گنجاندهشده در پردازندههای جدید
نیز نسبت به نسل قبل بسیار سریعتر شدهاست كه این موضوع نیز برای كاربرانی
كه قصد استفاده از گرافیك مجتمع دارند و همچنین كاربران كامپیوترهای همراه
بسیار خوشایند خواهدبود.