Головна

Графічні прискорювачі. Особливості організації пам'яті і обчислень. Шейдери.

  1.  Amp; && 470. Види пам'яті?
  2.  Amp; 21. Особливості фіктивності шлюбу як підстави його недійсності.
  3.  Cущность організації та її основні ознаки
  4.  I. Вибір місії організації.
  5.  I. Поняття про керівництво і лідерство в організації
  6.  II. Розвиток теорії лідерства (керівництва) в організації.
  7.  II. Розкриття інформації про облікову політику організації

(Пишу по його слайдів, хоча я-б все по іншому писав)

Склад: Графічний процесор, Видеоконтроллер, Відео-ПЗУ, Відеопамять Цифро-аналоговий перетворювач (ЦАП) (RAMDAC-Random Access Memory Digital-to-Analog Converter), Інтерфейс виведення на монітор, Система охолодження.

Графіка з пам'яттю(Shared graphics, Shared Memory Architecture). Відеопам'ять у вигляді спеціалізованих осередків як така відсутня; замість цього під потреби відеоадаптера динамічно виділяється область основної оперативної пам'яті комп'ютера. (Інтегровані відеокарти, є частиною північного моста). Переваги даного рішення - низька ціна і мале енергоспоживання. Недоліки - невисока продуктивність в 3D-графіку і негативний вплив на пропускну здатність пам'яті.

дискретна графіка (Dedicated graphics). Є своя відеопам'ять. Дискретна графіка забезпечує найвищу продуктивність в тривимірній графіці. (Виконані у вигляді окремих плат) Недоліки: більш висока ціна і більше енергоспоживання. Гібридна дискретна графіка (Hybrid graphics). Комбінація вищеназваних способів, що стала можливою з появою шини PCIExpress. Невеликий обсяг фізично розпаяно на платі відеопам'яті, який може розширюватися за рахунок використання основної оперативної пам'яті (ОЗУ).

спеціалізовані відеокарти. Застосовуються для високопродуктивних обчислень. Для виведення зображення на монітор не використовується.

Характеристики відеокарт:

ширина шини пам'яті, вимірюється в бітах - кількість біт інформації, переданої за такт. Важливий параметр в продуктивності карти.

обсяг відеопам'яті, вимірюється в мегабайтах - обсяг власної оперативної пам'яті відеокарти. частота ядра - вимірюються в мегагерцах

частота пам'яті - вимірюються в мегагерцах

текстурная швидкість заповнення, вимірюється в млн. пікселів в секунду, показує кількість виведеної інформації в одиницю часу

піксельна швидкість заповнення, вимірюється в млн. пікселів в секунду, показує кількість виведеної інформації в одиницю часу.

Шейдер.Шейдером в широкому сенсі називається програма для візуального визначення поверхні об'єкта.

вершинні шейдери(Vertex Shader) Верховий шейдер оперує даними, зіставленнями з вершинами багатогранників. До таких даних, зокрема, відносяться координати вершини в просторі, текстурні координати, тангенс-вектор, вектор бинормали, вектор нормалі. Верховий шейдер може бути використаний для видового і перспективного перетворення вершин, генерації текстурних координат, розрахунку освітлення і т. Д.

геометричні шейдери(Geometry Shader) Геометричний шейдер, на відміну від вершинного, здатний обробити не тільки одну вершину, але і цілий примітив. Це може бути відрізок (дві вершини) і трикутник (три вершини), а при наявності інформації про суміжних вершинах (adjacency) може бути оброблено до шести вершин для трикутного примітиву. Крім того, геометричний шейдер здатний генерувати примітиви «на льоту», чи не задіюючи при цьому центральний процесор. Вперше почав використовуватися на відкритих Nvidia серії 8.

піксельні шейдери (Pixel Shader) Фрагментний шейдер працює з фрагментами зображення. Під фрагментом зображення в даному випадку розуміється піксель, якому поставлене відповідність певний набір атрибутів, таких як колір, глибина, текстурні координати. Фрагментний шейдер використовується на останній стадії графічного конвеєра для формування фрагмента зображення.

Це я сам написав коротко:

Для GPGPU (довільні обчислення на графічних процесорних пристроях). Є мова OpenCL (відкритий, розробляється AMD), CUDA (частково відкритий, розробляється NVIDIA).

Модель використання - або використання однорівневих середовищ (thrust, boost), або використання бібліотек (CUBLAS, CUFFT і т. Д.) Або написання програм самому. Підтримують поки тільки С. Формат написання - ядра, що виконуються на GPU. Пам'ять повинна бути скопійована на GPU (в останніх версіях є спільна пам'ять - pinned memory).

Чому відео карти добре для обчислень - така ось архітектура:

 
 


7. Способи організації високопродуктивних процесорів: Асоціативні процесори. Клітинні та ДНК-процесори. Нейронні процесори. Процесори з нечіткою логікою. Основні принципи функціонування, передумови розвитку альтернативних способів організації МВС, поточні труднощі в реалізації.

асоціативні процесори Відносяться до класу SIMD. Адресація пам'яті по вмісту. АЗП - Асоціативне запам'ятовуючий пристрій. Асоціативний спосіб обробки даних дозволяє подолати багато обмежень, властиві адресного доступу до пам'яті, за рахунок завдання деякого критерію відбору та проведення необхідних перетворень, тільки над тими даними, які задовольняють цьому критерію. Критерієм відбору може бути збіг з будь-яким елементом даних, достатньою для виділення шуканих даних з усіх даних. Пошук даних може відбуватися за фрагментом, що має більшу або меншу кореляцію з заданим елементом даних.

Клітинні та ДНК-процесори.В даний час в пошуках реальної альтернативи напівпровідникових технологій створення нових обчислювальних систем вчені звертають дедалі більшу увагу на біотехнології, або біокомпьютінг, Який представляє собою гібрид інформаційних, молекулярних технологій, також біохімії.

(ЦЕ ЦІКАВО)Так само, як і будь-який інший процесор, ДНК процесор характеризується структурою і набором команд. У нашому випадку структура процесора - це структура молекули ДНК. А набір команд - це перелік біохімічних операцій з молекулами. Принцип пристрою комп'ютерної ДНК-пам'яті заснований на послідовному з'єднанні чотирьох нуклеотидів (основних цеглинок ДНК-ланцюги). Три нуклеотиду, з'єднуючись в будь-якій послідовності, утворюють елементарну комірку пам'яті - кодон, які потім формують ланцюг ДНК. Теоретичне обґрунтування такої можливості було зроблено ще в 50-х роках минулого століття (Р. П. Фейманом). В деталях ця теорія була опрацьована в 70-х роках Ч. Бенетта і в 80-х М. Конрадом. Перший комп'ютер на базі ДНК був створений ще в 1994 р американським ученим Леонардом Адлеманом. Він змішав в пробірці молекулу ДНК, в якій були закодовані вихідні дані, і спеціальним чином підібрані ферменти. В результаті хімічної реакції структура ДНК змінилася таким чином, що в ній в закодованому вигляді був представлений відповідь завдання. Оскільки обчислення проводилися в ході хімічної реакції за участю ферментів, на них було витрачено дуже мало часу. В кінці лютого 2002 р з'явилося повідомлення, що фірма Olympus Optical претендує на першість у створенні комерційної версії ДНК-комп'ютера, призначеного для генетичного аналізу. Машина була створена у співпраці з доцентом Токійського університету Акірою Тояма.
 Комп'ютер, побудований Olympus Optical, має молекулярну і електронну складові. Перша здійснює хімічні реакції між молекулами ДНК, забезпечує пошук і виділення результату обчислень. Друга - обробляє інформацію і аналізує отримані результати.
 Можливостями біокомп'ютерів зацікавилися і військові. Американське агентство з досліджень в області оборони DARPA виконує проект, що отримав назву Bio-Comp (Biological Computations, біологічні обчислення). Його мета - створення потужних обчислювальних систем на основі ДНК.

переваги:

простіша технологія виготовлення, яка не потребує для своєї реалізації таких жорстких умов, як при виробництві напівпровідників;

використання не бінарного, а тернарного коду (інформація кодується трійками нуклеотидів), що дозволить за меншу кількість кроків перебрати більше число варіантів при аналізі складних систем;

потенційно виключно висока продуктивність, яка може становити до 1014 операцій в секунду за рахунок одночасного вступу в реакцію трильйонів молекул ДНК;

можливість зберігати дані з щільністю, в трильйони разів перевищує показники оптичних дисків;

виключно низьке енергоспоживання.

недоліки:

складність зі зчитуванням результатів - сучасні способи визначення послідовності, що кодує недосконалі, складні, трудомісткі і дороги;

низька точність обчислень, пов'язана з виникненням мутацій, прилипанием молекул до стінок судин і т. д .;

неможливість тривалого зберігання результатів обчислень в зв'язку з розпадом ДНК протягом часу.

клітинні комп'ютери являють собою самоорганізуються колонії різних "розумних" мікроорганізмів, в геном яких вдалося включити якусь логічну схему, яка могла б активізуватися в присутності певної речовини. Для цієї мети ідеально підійшли б бактерії, стакан з якими і представляв би собою комп'ютер. Такі комп'ютери дуже дешеві у виробництві. Їм не потрібна настільки стерильна атмосфера, як при виробництві напівпровідників. Головною властивістю комп'ютера такого роду є те, що кожна їх клітина являє собою мініатюрну хімічну лабораторію. Якщо біоорганізми запрограмований, то він просто робить потрібні речовини. Досить виростити одну клітку, що володіє заданими властивостями, і можна легко і швидко виростити тисячі клітин з такою ж програмою. Основна проблема, З якою стикаються творці клітинних біокомп'ютерів, - організація всіх клітин в єдину працюючу систему. На сьогоднішній день практичні досягнення в області клітинних комп'ютерів нагадують досягнення 20-х років в області лампових і напівпровідникових комп'ютерів.

Штучні нейронні мережі (Фуфел =))

Нейрони групуються в послідовність шарів; вхідні сигнали надходять на перший шар і послідовно проходять через всі шари до останнього, вихідного шару мережі. Але бувають і рекурентні (з циклами) структури, що забезпечують циркуляцію деякого набору внутрішніх сигналів.

Штучна нейросеть, може навчатися: вона містить внутрішні адаптивні параметри нейронів і своєї структури, і, змінюючи їх, може змінювати свою поведінку, домагаючись поліпшення точності рішення деякої задачі.

Навчання або настройка нейронної мережі: при переході до нової задачі не потрібно заново програмувати алгоритм - можна просто взяти універсальний нейросетевой інструмент і в ньому створити і навчити нейромережа.

Нейронна мережа навчається вирішення завдання на деякому наборі ситуацій, кожна з яких описує значення вхідних сигналів нейромережі і необхідний при цих вхідних сигналах відповідь.

Крім навчання з учителем (на основі знань про відомих еталонних відповідях для деякого набору ситуацій) можливо і навчання без учителя - при цьому відбувається аналіз описів ситуацій і шукаються ті чи інші тенденції (наприклад, схожі ситуації об'єднуються в групи так, щоб дані всередині групи були більше схожі один на одного, ніж на дані з іншої групи).

Нейронна мережа здатна навчатися вирішення завдань, для яких не існує формалізованих, швидких або працюють з прийнятною точністю теоретичних або емпіричних алгоритмів.

Структура нейромережі може бути адаптована до задачі.

Процесори з нечіткою логікою. Ідея побудови процесорів з нечіткою логікою (fuzzy logic) Грунтується на нечіткій математиці. Підходи нечіткої математики дають можливість оперувати вхідними даними, безперервно змінюються в часі і значеннями, які неможливо задати однозначно, такими, наприклад, як результати статистичних опитувань. На відміну від традиційної формальної логіки, відомої з часів Аристотеля і оперує точними і чіткими поняттями типу істина і брехня, та й немає, нуль і одиниця, нечітка логіка має справу зі значеннями, що лежать в деякому (безперервному або дискретному) діапазоні. згідно знаменитої теоремі FAT (Fuzzy Approximation Theorem), доведеною Коско,будь-яка математична системаможе бути аппроксимирована системою, заснованої на нечіткої логіки. Своє друге народження теорія нечіткої логіки пережила на початку вісімдесятих років, коли відразу кілька груп дослідників (в основному в США і Японії) всерйоз зайнялися створенням електронних систем різного застосування, що використовують нечіткі керуючі алгоритми. Використовуючи переваги нечіткої логіки, які полягають в простоті змістовного уявлення, можна спростити проблему, представити її в більш доступному вигляді і підвищити продуктивність системи.

Завдання за допомогою нечіткої логіки вирішуються за наступним принципом: 1)чисельні дані (показання вимірювальних приладів, результати анкетування) фаззіруются (переводяться в нечіткий формат);2)обробляються за певними правилами; 3) дефаззіруются і у вигляді звичної інформації подаються на вихід.

Ідеї ??нечіткої логіки не є панацеєю і не зможуть зробити переворот в комп'ютерному світі. Нечітка логіка не вирішить тих завдань, які не вирішуються на основі логіки двійковій, але в багатьох випадках вона зручніше, продуктивніше і дешевше. Розроблені на її основі спеціалізовані апаратні рішення (fuzzy-обчислювачі) дозволять отримати реальні переваги у швидкодії. Якщо каскадировать fuzzy-обчислювачі, ми отримаємо один з варіантів нейропроцесора або нейронної мережі. У багатьох випадках ці поняття просто об'єднують, називаючи загальним терміном "neuro-fuzzy logic". В даний час перспективою використовувати процесори, засновані на нечіткій логіці всерйоз зацікавився військові. Відомо, що NASA розглядає можливість застосування (якщо ще не застосовує) нечіткі системи для управління процесами стикування космічних апаратів.



 види кешей |  Спеціалізовані процесори. Комунікаційні процесори. Конвеєрні процесори. Матричні процесори. Застосування. Основні принципи функціонування.

 Список завдань для високопродуктивних систем. Основні визначення. МВС. Суперкомп'ютер. Кластер. Грід-система. HPC (eng). та ін. |  Системи розподілених обчислень (grid) |  Переваги моделей із загальною |  Топології мереж МВС. Сфера застосування. Властивості. Характеристики. Приклади використання. |  ТОПОЛОГІЇ ХАРАКТЕРНІ ДЛЯ МВС |  Комутатори для МВС. Прості комутатори. Алгоритми арбітражу. Складові комутатори. Комутатор Клоза. Баньян-мережі. |  Способи оцінки продуктивності МВС. Методи оцінки. Види оцінок. Принципи формування top 500 і. ін. top. |  Надійність відмовостійкість і інші характеристики МВС. Вимоги до компонентів МВС. |  Прискорення і ефективність паралельних програм. Інформаційні залежності за даними. Закон Амдала. |  Проблема недетермінізма в багатопоточних програмах. Підтримка синхронізації потоків в POSIX Threads. Критичні секції. |

© um.co.ua - учбові матеріали та реферати