CUDA(Compute Unified Device Architecture)는 여러분들도 잘 아시다시피, NVIDIA의 GPU를 활용해 병렬 계산을 수행할 수 있도록 해주는 프로그래밍...
PCIe(Peripheral Component Interconnect Express)는 고속 데이터 전송을 위한 컴퓨터 확장 슬롯(인터페이스) 표준을 뜻하며, 그래픽 카드(GPU),...
NVMe(Non-Volatile Memory Express) 스토리지는 고속 SSD(Solid State Drive) 인터페이스 및 프로토콜로, 기존 SATA(SATA SSD) 및...
HPC&AI 고성능 네트워킹에서 NVIDIA의 인피니티밴드(Infiniband)과 RoCE(RDMA over Converged Ethernet) 기술은 양대 산맥으로 흔히...
앞서 RDMA에 대한 글을 적으며, 한 가지 '지연(latency)'에 대한 용어에 대해 좀 더 상세히 설명해야겠다는 생각이 들었다. 왜냐하면, 지연(latency)이란 데이터가...
RDMA(Remote Direct Memory Access)는 네트워크를 통해 서버 간에 CPU 개입 없이 메모리를 직접 읽고 쓰는 기술이다. 주로 고성능 컴퓨팅(HPC), 대규모...
세계 가전쇼(CES) 2025의 NVIDIA 키노트 중에서 에이전틱 AI에 대해 스쳐 지나 갔는 데, 구체적으로 어떤 내용인지 궁금해서 조사해보았다. 더욱이 요즘은 생성형 AI...
CES 2025 - NVIDIA Keynote 발표에서 공개된 기술 및 프레임워크 주요 노트 <개발자 테크 블로그> 새 NVIDIA NeMo...
국내 기업들을 방문해서 AI 인프라 관련 분들을 만나면, 가장 많이 물어보는 질문들 중 하나가 LLM 추론 시 메모리 크기는 얼마나 되는 것인 가이다. 아무래도내부에 가진 서버를...
흔히 IT 관련 미디어를 보면, 메타 라마가 오픈소스라고 많이 적혀져 있다. 물론 이것은 메타가 그렇게 주장하고 있지만, 정통 인공지능 개발자들 사이에서는 이러한 메타 라마가...
고객 방문 세미나를 하면, 가끔 기본적인 질문을 하는 분들이 있다. 벡터와 텐서의 차이점에 대해 무엇이냐고? 이것에 대한 답변은 인공지능을 처음 배울 때 나오는 내용이다. 특히,...
친구들, 안녕하세요? 우연찮게 아는 분 블로그 들어갔다가 Dev.to 를 알게 되었고, 한번 테스트해 보았는 데, 저의 마음에 들어서 앞으로 여기에 글들을 올려 보도록 하겠습니다....