▌SiSoftware - Sandra
▒ 시소프트웨어 - 산드라
영국의 SiSoftware에서 개발한 시스템 분석, 진단 및 보고서 도우미라는 뜻을 가진 Sandra (System ANalyser, Diagnostic and Reporting Assistant)는 Windows 95 시절부터 지금에 이르기까지 끊임없는 연구 개발을 이어오고 있는 고급 벤치마크 도구입니다.
최근 유행하는 크로스-플랫폼이 아닌 Windows 운영체제 전용 어플리케이션이지만 오랜 역사만큼 다양한 하드웨어와 소프트웨어 트렌드에 맞는 벤치마크 툴을 내장하고 있어, 흥미 위주의 개인부터 기업 내 IT 전문가에 이르기까지 폭넓은 사용자층을 위한 진단 기능을 제공합니다.
심플한 스코어 산출 방식을 넘어 하드웨어가 지닌 다양한 기능들을 세부적으로 나누어 특장점을 분석할 수도 있고, 용도에 따른 시나리오별 테스트로 적합한 제품을 찾는 방법으로도 활용할 수 있습니다.
특히 프로세서의 경우 범용성이 높다보니 단순 수치 표현으로는 실제 성능과 이어지지 않거나, 상용 프로그램 및 시나리오 테스트 결과는 필연적으로 편향성이 나타나기도 합니다. 그나마 Sandra는 정수(Integer)와 부동소수점(Floating-Point) 등의 개별적인 성능을 측정할 수 있어 중립적인 결과 분석이 가능한 편 입니다.

프로세서 외에도 다양한 장치들을 기술적으로 분류된 테스트나 용도별 시나리오 테스트를 통해 필요한 측정값을 확인할 수 있습니다.
▌Processor Arithmetic Test
▒ 프로세서 산술 연산 테스트
산드라의 Arithmetic 테스트는 SISD(Single Instruction Single Data) 방식에 기반한 프로세서의 기초적인 연산 처리 성능을 측정합니다.
오버클럭과 같이 동일한 아키텍처에 클럭 스피드만 다른 프로세서를 비교하거나, 최신 SIMD 명령어 세트를 사용하지 않는 레거시 프로그램 등의 일반적인 환경에 적용할 수 있습니다. 또한 테스트 명칭과 같이 수학적인 연산이 주를 이루는 과학이나 금융 분야에서도 참고할 수 있는 결과를 제공합니다.
오랜 전통의 합성 벤치마크 알고리즘인 드라이스톤(Dhrystone)과 웨트스톤(Whetstone)을 활용하여 정수(IPS, Instructions per Second) 및 부동소수점(FLOPS, FLoating-point Operations per Second) 연산 성능을 측정합니다.

테스트를 완료하면 하단의 텍스트 박스에 세부적인 결과가 출력됩니다. 온라인 DB의 다른 결과값도 함께 확인할 수 있습니다.
▌Processor Multi-Media Test
▒ 프로세서 멀티 미디어 처리 테스트
Multi-Media 테스트는 간단히 말해 영상 및 음향 데이터 처리 성능을 나타냅니다.
멀티 미디어 처리의 경우 다수의 데이터에 동일한 작업을 반복하는 SIMD(Single Instruction Multiple Data) 방식을 주로 활용하기 때문에 AVX, SSE 및 FMA와 같은 명령어 세트가 적용된 상태의 프로세서 성능을 측정한다고 보아도 무방합니다.
이미지나 동영상의 인코딩 작업이나 렌더링 같은 멀티 미디어 작업은 벤치마크 테스트 결과와 실제 성능이 가장 유사한 사례로 꼽히는데, 특히 SSE 나 AVX 같은 명령어 세트의 적용 여부가 성능에 큰 영향을 미치는 편입니다. 게임 분야의 경우는 특정 명령어 세트를 지원하지 않으면 실행조차 거부될 정도로 현대 프로세서의 핵심적인 역량이라고 할 수 있습니다.
한 번의 명령어로 다수의 데이터를 처리할 수 있기 때문에 데이터 단위를 바꿔가며 측정을 진행하고, 테스트가 끝나면 모든 측정단위를 종합한 결과값(Aggregate)도 함께 제공됩니다. INDEX.DR 퍼포먼스 미터는 정수(Integer)와 부동소수점(Floating-Point) 각각의 Aggregate 측정값을 기록합니다.

벡터 기반 SIMD 방식을 시뮬레이션하는 테스트로 결과값은 정수와 부동소수점 모두 Mega Pixels per Second (MPix/s) 단위로 표시됩니다.
▌Cache Bandwidth Test
▒ 캐시 대역폭 테스트
산드라의 Cache Bandwidth 테스트는 메모리 벤치마크 도구에 포함되어 있지만, 근본적으로 프로세서에 내장된 캐시 메모리의 성능을 측정하는 만큼 INDEX.DR 퍼포먼스 미터는 프로세서 측정에 포함시켰습니다.
버스 인터페이스나 베이스 클럭에(FSB, BCLK)에 동기화되는 시스템 메모리(SDRAM)와 달리, 캐시 메모리는 프로세서 내부에 탑재되어 CPU 코어 클럭과 동기화되기 때문에 고속으로 동작하며, 이에 따라 용량이 그리 크지 않음에도 불구하고 상당한 수준의 대역폭을 제공할 수 있습니다.
물론 프로세서 아키텍처에 따라 활용하는 방법이 다르기 때문에 캐시 메모리의 대역폭이 시스템 성능과 일치하지는 않지만, 각 CPU 코어가 얼마나 효율적으로 데이터에 접근할 수 있도록 설계되었는지 가늠해 볼 수 있습니다.

캐시 대역폭 테스트는 Aggregate 결과값 대신 상세 내역에서 확인할 수 있는 L1 Data / L2 / L3 대역폭을 따로 기재합니다.