16TB 미국 연방 공개 데이터 세트 아카이브 공개

2025-02-07
16TB 미국 연방 공개 데이터 세트 아카이브 공개

하버드 로스쿨 연구원들은 31만 1천 개가 넘는 데이터 세트를 포함한 16TB 아카이브를 공개했습니다. 이는 2024년과 2025년 data.gov의 완전한 아카이브입니다. 이 프로젝트는 자세한 메타데이터와 디지털 서명을 유지함으로써 데이터의 무결성과 신뢰성을 보장하는 것을 목표로 하며, 연구자와 일반 대중이 시간이 지남에 따라 이 정보를 인용하고 액세스하는 것을 용이하게 합니다. 다른 사람들이 작업을 복제하고 유사한 저장소를 만들 수 있도록 오픈 소스 소프트웨어와 문서도 공개됩니다. 이 프로젝트는 Filecoin Foundation과 Rockefeller Brothers Fund의 지원을 받고 있습니다.

더 보기

세기적 규모의 디지털 저장: 시간과의 싸움

2024-12-14
세기적 규모의 디지털 저장: 시간과의 싸움

이 글은 디지털 데이터를 100년 동안 저장하는 과제를 탐구합니다. IBM의 최초 하드 드라이브 장착 컴퓨터인 RAMAC의 발명부터 오늘날 클라우드 스토리지의 보편화에 이르기까지 저자는 하드 드라이브, 클라우드 스토리지, 이동식 미디어, 물리적 각인 또는 인쇄 등 다양한 저장 방식의 장단점을 분석합니다. 이 글은 하드웨어의 물리적 손상, 소프트웨어 업데이트, 기관의 변화, 시장 변동 등 장기적인 데이터 보존에 대한 위협을 강조합니다. 궁극적으로 저자는 세기적 규모의 디지털 저장의 핵심은 유지 보수와 보존을 중시하는 문화를 구축하는 데 있으며, 시간의 침식과 싸우고 인류의 디지털 유산을 보호하기 위해 사회의 모든 부문의 집단적 노력이 필요하다고 주장합니다.

더 보기