Поиск
Показаны результаты для тегов 'процессор'.
Найдено 4 результата
-
Сегодня классическая компьютерная архитектура фон-Неймана стала препятствием для наращивания вычислительных возможностей. Частично вина за это лежит на обмене данными процессора с внешней памятью. Хранение данных в процессоре — где они обрабатываются — многократно помогло бы снизить потребление компьютеров. Первый такой процессор для задач ИИ создали в Швейцарии. В его основе лежат новые атомарно тонкие полупроводники, а не кремний. Исследователи из Федеральной политехнической школы Лозанны (EPFL) опубликовали в журнале Nature Electronics статью, в которой сообщили о создании процессора из 1024 транзисторов на основе дисульфида молибдена (MoS2). Они не первые, кто обратил внимание на этот полупроводник. Слой дисульфида молибдена имеет толщину в три атома и неплохо зарекомендовал себя в опытных разработках в качестве рабочего канала транзисторов. По большому счёту его можно рассматривать как графен в мире полупроводников. Его характеристики и методы получения во многом напоминают работу с моноуглеродными слоями. Свой первый образец MoS2 исследователи из EPFL 13 лет назад получали с помощью скотча, отбирая липкой лентой с основы чешуйки материала. Сегодня они уже могут производить целые пластины дисульфида молибдена, из которых, в частности, был изготовлен кристалл процессора площадью 1 см2. И поскольку это полупроводник, технологию производства таких процессоров можно будет внедрять на действующих заводах, где уже обрабатывается кремний. Каждый транзистор из MoS2 в опытном процессоре также содержит управляющий плавающий затвор. Затвор предназначен для хранения бита данных и для управления транзистором. Данные вычислений остаются в процессоре и участвуют в дальнейшей работе процессора. Никуда вовне обрабатываемые данные не пересылаются и ниоткуда не загружаются. Мы просто подаём на вход процессора информацию для обработки, а на выходе получаем готовый результат. Представленный прототип процессора с вычислениями в памяти предназначен для выполнения одной из фундаментальных операций обработки данных — векторно-матричного умножения. Эта операция повсеместно используется при цифровой обработке сигналов и реализации моделей искусственного интеллекта. Очевидно, что сегодня такие решения находятся на пике спроса. Как уверяют разработчики, создав масштабный рабочий прототип, они доказали возможность переноса проекта на заводы для массового выпуска. Отдельно исследователи заявили, что разработка дошла до своей реализации благодаря усиленному финансированию со стороны властей Европейского союза, который стремится вернуть Европе звание лидера рынка полупроводников.
-
Микросхема WSE изготовлена по современному 7-нм техпроцессу и содержит умопомрачительные 2,6 триллиона транзисторов, объединённых в 850 000 вычислительных ядер. Гигантский размер — не рекорд ради рекорда. Размещение огромного количества ядер на одном кристалле имеет существенные практические преимущества при моделировании нейронных сетей — а именно для этой цели предназначен новый супер-чип. В настоящее время большая часть нейровычислений выполняется при помощи графических процессоров (GPU). Они подходят для этого лучше, чем CPU, поскольку содержат множество блоков, способных работать параллельно, и могут быстро выполнять операции над матрицами, к которым по большей части и сводится работа искусственных нейросетей. Но всё-таки изначально GPU разрабатывались с другими целями, и почти 90% их площади занимают компоненты, которые не могут быть использованы для задач искусственного интеллекта. Да и объём памяти на кристалле, которым располагают GPU, для этих целей слишком мал. Вычислительная система CS-1 на базе Wafer Scale Engine Архитектура WSE была специально разработана для нейровычислений и потому избавлена от вышеописанных недостатков. Здесь прямо на кристалле размещено 36 гигабайт памяти с максимально коротким временем доступа: все обращения обрабатываются за один такт, т. е. быстрее чем за наносекунду. Память обладает беспрецедентно высокой пропускной способностью — 9 петабайт в секунду (это в тысячи раз быстрее, чем в классических системах, где память реализована отдельно). Для связи между ядрами внутри одного блока и между разными блоками используются одинаковые интерфейсы, которые ещё на порядок быстрее. И всё-таки в первую очередь создание WSE — это не архитектурный, а технологический триумф. Разработчикам пришлось решить массу проблем, которые просто не возникают в случае с чипами привычного размера. Так, супер-микросхема выделяет 15 кВт тепла, поэтому для неё не подходила ни одна из существующих систем охлаждения. Блок с микросхемой WSE и системой питания. Справа — коннекторы для водяных помп Высокопроизводительная помпа системы охлаждения Более того, из-за огромных габаритов микросхемы возник эффект неравномерного теплового расширения кристалла и подложки, и пришлось ввести дополнительный компенсирующий слой. Трёхмерная система подвода электропитания, рассчитанная на ток 20 000 ампер, тоже была разработана специально для данного проекта. Корпусировку изделия и вовсе пришлось выполнять вручную. Компания TSMC, на мощностях которой выпускаются гигантские «вафли», смогла обеспечить сверхнизкий процент производственного брака, что позволило заложить в схему всего 1% дополнительных ядер, которые должны подменять неработоспособные. Важное преимущество разработки Cerebras Systems — полная совместимость с существующими программными комплексами для разработки систем глубокого обучения, в частности, PyTorch и TensorFlow. При переходе на WSE не требуется переписывать ПО. Разработчики подсчитали, что вычислительная система на базе Wafer Scale Engine — CS-1 — в 150 раз производительнее, чем лучший из нынешних серверов на GPU, DGX-1, при этом занимает в 40 раз меньше места и потребляет в 20 раз меньше энергии. Вычислительная система CS-1 без корпуса Наверное, последней в ряду впечатляющих цифр должна стать стоимость микросхемы. Компания её не раскрывает, но по косвенным признакам можно судить, что она превышает 2 млн долларов. Это не отпугивает потенциальных заказчиков. Системы CS-1 уже работают в Аргоннской национальной лаборатории под Чикаго и Ливерморской национальной лаборатории им. Лоуренса; также они должны лечь в основу нового суперкомпьютера Neocortex в Питтсбурге. Благодаря разработкам Cerebras Systems на обучение сложных нейросетей будут уходить часы, а не недели, а значит, можно будет опробовать намного больше разных вариантов. Возможно, в перспективе подобные системы помогут в реализации таких амбициозных планов, как моделирование работы мозга высших животных в реальном времени.
-
- wafer scale engine
- процессор
- (и ещё 4 )
-
Микросхема WSE изготовлена по современному 7-нм техпроцессу и содержит умопомрачительные 2,6 триллиона транзисторов, объединённых в 850 000 вычислительных ядер. Гигантский размер — не рекорд ради рекорда. Размещение огромного количества ядер на одном кристалле имеет существенные практические преимущества при моделировании нейронных сетей — а именно для этой цели предназначен новый супер-чип. В настоящее время большая часть нейровычислений выполняется при помощи графических процессоров (GPU). Они подходят для этого лучше, чем CPU, поскольку содержат множество блоков, способных работать параллельно, и могут быстро выполнять операции над матрицами, к которым по большей части и сводится работа искусственных нейросетей. Но всё-таки изначально GPU разрабатывались с другими целями, и почти 90% их площади занимают компоненты, которые не могут быть использованы для задач искусственного интеллекта. Да и объём памяти на кристалле, которым располагают GPU, для этих целей слишком мал. Вычислительная система CS-1 на базе Wafer Scale Engine Архитектура WSE была специально разработана для нейровычислений и потому избавлена от вышеописанных недостатков. Здесь прямо на кристалле размещено 36 гигабайт памяти с максимально коротким временем доступа: все обращения обрабатываются за один такт, т. е. быстрее чем за наносекунду. Память обладает беспрецедентно высокой пропускной способностью — 9 петабайт в секунду (это в тысячи раз быстрее, чем в классических системах, где память реализована отдельно). Для связи между ядрами внутри одного блока и между разными блоками используются одинаковые интерфейсы, которые ещё на порядок быстрее. И всё-таки в первую очередь создание WSE — это не архитектурный, а технологический триумф. Разработчикам пришлось решить массу проблем, которые просто не возникают в случае с чипами привычного размера. Так, супер-микросхема выделяет 15 кВт тепла, поэтому для неё не подходила ни одна из существующих систем охлаждения. Блок с микросхемой WSE и системой питания. Справа — коннекторы для водяных помп Высокопроизводительная помпа системы охлаждения Более того, из-за огромных габаритов микросхемы возник эффект неравномерного теплового расширения кристалла и подложки, и пришлось ввести дополнительный компенсирующий слой. Трёхмерная система подвода электропитания, рассчитанная на ток 20 000 ампер, тоже была разработана специально для данного проекта. Корпусировку изделия и вовсе пришлось выполнять вручную. Компания TSMC, на мощностях которой выпускаются гигантские «вафли», смогла обеспечить сверхнизкий процент производственного брака, что позволило заложить в схему всего 1% дополнительных ядер, которые должны подменять неработоспособные. Важное преимущество разработки Cerebras Systems — полная совместимость с существующими программными комплексами для разработки систем глубокого обучения, в частности, PyTorch и TensorFlow. При переходе на WSE не требуется переписывать ПО. Разработчики подсчитали, что вычислительная система на базе Wafer Scale Engine — CS-1 — в 150 раз производительнее, чем лучший из нынешних серверов на GPU, DGX-1, при этом занимает в 40 раз меньше места и потребляет в 20 раз меньше энергии. Вычислительная система CS-1 без корпуса Наверное, последней в ряду впечатляющих цифр должна стать стоимость микросхемы. Компания её не раскрывает, но по косвенным признакам можно судить, что она превышает 2 млн долларов. Это не отпугивает потенциальных заказчиков. Системы CS-1 уже работают в Аргоннской национальной лаборатории под Чикаго и Ливерморской национальной лаборатории им. Лоуренса; также они должны лечь в основу нового суперкомпьютера Neocortex в Питтсбурге. Благодаря разработкам Cerebras Systems на обучение сложных нейросетей будут уходить часы, а не недели, а значит, можно будет опробовать намного больше разных вариантов. Возможно, в перспективе подобные системы помогут в реализации таких амбициозных планов, как моделирование работы мозга высших животных в реальном времени. Просмотр полной топик
-
- wafer scale engine
- процессор
- (и ещё 4 )