featured Archives - Cerebras

Machine LearningBlogLarge Language ModelNLPDeep Learning

April 12, 2024

Cerebras CS-3 vs. Nvidia B200: 2024 AI Accelerators Compared

In the fast-paced world of AI hardware, the Cerebras CS-3…

Machine LearningBlogLarge Language ModelNLPDeep Learning

March 12, 2024

Cerebras CS-3: the world’s fastest and most scalable AI accelerator

Today Cerebras is introducing the CS-3, our…

Machine LearningBlogLarge Language ModelNLPDeep Learning

March 11, 2024

Cerebras and Qualcomm Unleash ~10X Inference Performance Boost with Hardware-Aware LLM Training

Machine LearningBlogLarge Language ModelNLPDeep Learning

February 5, 2024

Sparsity Made Easy – Introducing the Cerebras PyTorch Sparsity Library

We release our PyTorch-based sparsity library allowing ML…

Machine LearningBlogLarge Language ModelNLPDeep Learning

January 24, 2024

Cerebras announces support for NSF’s NAIRR Pilot, aimed at advancing our nation’s leadership in AI computing and research

Machine LearningBlogLarge Language ModelNLPDeep Learning

December 29, 2023

Introducing gigaGPT: GPT-3 sized models in 565 lines of code

GigaGPT is Cerebras’ implementation of Andrei Karpathy’s…

by William Marshall

Machine LearningBlogLarge Language ModelNLPDeep Learning

December 29, 2023

Cerebras 2024 Predictions for Generative AI, LLMs, and HPC

Press ReleaseIn the News

December 14, 2023

Cerebras, Petuum, and MBZUAI Announce New Open-Source CrystalCoder and LLM360 Methodology to Accelerate Development of Transparent and Responsible AI Models

Machine LearningBlogLarge Language ModelNLPDeep Learning

December 5, 2023

Cerebras Pioneers Ethical AI Development through Collaborative AI Initiatives

Today, Cerebras proudly revealed our pivotal role as a…

Machine LearningBlogLarge Language ModelNLPDeep Learning

November 10, 2023

Cerebras Software Release 2.0: 50% Faster Training, PyTorch 2.0 Support, Diffusion Transformers, and More

Today we are excited to announce Cerebras software release…

Machine LearningBlogLarge Language ModelNLPDeep Learning

October 12, 2023

How we fine-tuned Llama2-70B to pass the US Medical License Exam in a week

New open-access model by M42 outperforms GPT-3.5 in…

Machine LearningBlogLarge Language ModelNLPDeep Learning

September 5, 2023

Jais: a New Pinnacle in Open Arabic NLP

Introducing a new state-of-the-art bi-lingual…

by Dr. Andrew Jackson

Machine LearningBlogLarge Language ModelNLPDeep Learning

July 24, 2023

BTLM-3B-8K: 7B Performance in a 3 Billion Parameter Model

Cerebras and Opentensor introduce a new standard for…

Machine LearningClusterCloudBlogLarge Language ModelNLPDeep Learning

July 20, 2023

Introducing Condor Galaxy 1: a 4 exaFLOPS Supercomputer for Generative AI

Cerebras, in partnership with G42 unveils CG-1, a 4…

Machine LearningSoftwareCloudBlogDeveloper BlogLarge Language ModelNLPDeep Learning

June 9, 2023

SlimPajama: A 627B token, cleaned and deduplicated version of RedPajama

Today we are releasing SlimPajama – the largest…

by Daria Soboleva

Machine LearningSoftwareBlogDeveloper Blog

May 22, 2023

Cerebras Architecture Deep Dive: First Look Inside the HW/SW Co-Design for Deep Learning [Updated]

Our ML-optimized architecture enables the largest models to…

Machine LearningSoftwareClusterCloudBlogDeveloper Blog

March 28, 2023

Cerebras-GPT: A Family of Open, Compute-efficient, Large Language Models

Cerebras open sources seven GPT-3 models from 111 million…

ChipMachine LearningSoftwareClusterBlogHPCDeveloper Blog

November 28, 2022

Harnessing the Power of Sparsity for Large GPT AI Models

Enabling innovation of novel sparse ML techniques to…

ChipMachine LearningSoftwareBlogDeveloper Blog

August 15, 2022

Context is Everything: Why Maximum Sequence Length Matters

GPU-Impossible™ sequence lengths on Cerebras systems may…