
검색 시작(6/7): 비용을 제어하는 키는 견적 확인에 있습니다 (Part 1)
2020년 3월 1일
수십 건의 학습 데이터로 "사람의 판단"을 재현
2020년 3월 23일
A B C D E F G H I J K L M
N O P Q R S T U V W X Y Z
아 하나 말이야 한 마라 は 또는 や 외 원
A
AccessData
조사 도구인 FTK를 제조·판매하는 미국 기업.
Android
Google사가 2007년에 발표한 휴대전화 등의 모바일 기기용 OS.
APFS (애플 파일 시스템)
Apple이 20년 만에 도입하는 새로운 파일 시스템으로 플래시 메모리 및 SSD에 최적화되어 암호화에 중점을 두고 있다.
B
바이오스 (Basic Input/Output System)
펌웨어 중 하나.컴퓨터에 연결된 주변 장치를 제어하는 프로그램으로 최하위 레벨의 입출력을 수행하는 프로그램.
검은 가방
Mackintosh의 보전·해석 툴인 MacQuisition·Black Light를 제조·판매하는 기업.
검은 빛
Black Bag사가 제공하는 Mac에 대응하는 이미지 파일 해석 툴. FTK와 마찬가지로, 취득한 이미지 데이터로부터 데이터베이스를 자동 작성해, 통합한 해석 환경을 제공한다.
C
CHS(Cylinder / Head / Sector)
실린더수, 헤드수, 섹터수의 XNUMX개의 요소를 이용함으로써, 하드 디스크나 플로피 디스크의 기록 매체에 액세스할 때에 그 절대 위치를 나타내는 방식.
Concept Encoder
FRONTEO 헬스케어가 헬스케어 인더스트리에 특화해 개발한 인공지능(AI).읽기: 컨셉 인코더.자유 기술의 텍스트 데이터를 대량으로 포함한 헬스케어 관련 빅데이터를 근거(근거)에 근거하여 유효하게 해석·활용하는 것을 목표로 개발되었다.헬스케어 종사자의 공통인식인 ‘에비던스에 근거한 의료(EBM)’에 빼놓을 수 없는 유의차 검정 등의 통계학적 수법을 자연언어 해석에 도입, 실현하고 있다.
CPU(Central Processing Unit)
컴퓨터의 구성 부품의 하나로, 1대 장치의 제어 장치, 연산 장치에 해당한다.중앙 연산 처리 장치라고도 불리고, 컴퓨터에 장착된 각 장치의 제어나 데이터의 계산·가공을 행하는 장치.
D
DF(Document Frequency)
해석 대상의 문서군 중, 그 형태소가 몇개의 문서에 출현했는지를 나타낸다.
디지털 인텔리전스 (DI)
미국의 디스커버리 종합 서비스 기업.디스커버리나 포렌식 서비스를 시작해 포렌식 관련 소프트웨어나 하드웨어, 트레이닝 등을 제공하고 있다.
E
케이스
법의학 조사 기술의 글로벌 표준 제품으로, 법의학 컬리 사운드 (Forensically Sound, 법의학의 견해 및 방법)를 기반으로 데이터 수집 및 조사를 지원하는 소프트웨어.데이터 프리뷰 외에, 데이터의 복원, 특정의 조건에 일치하는 데이터의 추출(좁힌)등이 가능.
에시(Electronically Stored Information)
전자적으로 저장된 정보.전자 데이터.
exFAT(Extended FAT)
기존의 FAT32를 확장한 Microsoft사가 개발한 파일 시스템.대용량의 지원을 목적의 하나로 해, 리무버블 미디어용의 파일 시스템으로서 개발되었다. FAT64라고도 할 수 있다.
내선2 / 내선3 / 내선4 (Extended File System)
Linux/UNIX OS에서 사용되는 파일 시스템. ext3/ext4는 저널링 기능을 가진 파일 시스템.
e디스커버리(e-Discovery)
전자 증거 공개 시스템을 참조하십시오.
이메일 스레딩(Email Threading)
전자 메일의 전체 대화를 순서대로 구성합니다.이메일 검토 시간 단축에 도움이 됩니다.
이메일 패밀리(Email Family)
이메일 본문과 첨부 파일을 하나의 그룹으로 취급하는 것.
F
FAT(File Allocation Table)
Windows OS/Mac OS/UNIX(Linux) 등, 다양한 OS에서 인식 가능한 파일 시스템이며, HDD 파티션 외에, FDD나 USB 메모리, SD 카드 등의 스토리지의 포맷 형식으로서도 이용되고 있다(형식 로는 FAT12, FAT16, FAT32가 있다).
FTK
포렌식 조사 기술의 글로벌 표준 제품이며 데이터 수집 및 조사를 지원하는 소프트웨어. PRTK나 Registry Viewer와의 제휴도 가능.데이터 프리뷰, 데이터 복원, 특정 조건에 일치하는 데이터 추출(좁힌) 등이 가능.
FTK 이미 저
데이터 미리보기 및 이미지 파일 작성 도구.물리적으로 접속되어 있는 드라이브나 로지컬 데이터의 열람에 가세해, 포렌식 이미지 파일의 전개나 데이터의 해시치 산출, 간이적인 데이터 복원도 가능.
G
GUIDANCE SOFTWARE
조사 도구인 EnCase를 제조·판매하는 미국 기업.
H
HFS/HFS+(Hierarchical File System)
Apple의 OS인 Mac OS에서 사용되는 파일 시스템. HFS+에서는 데이터의 신뢰성을 높이기 위해 저널링 기능이 추가되었다.
I
IDE (Integrated Drive Electronics)
PC에서 일반적으로 사용되는 하드 디스크를 연결하는 인터페이스.간이적인 구조를 하고 있기 때문에, 하드 디스크 드라이브의 가격을 억제할 수 있다.현재 사용되고 있는 것은, 원래의 IDE를 확장한 「EIDE(Enhanced IDE)」라고 불리는 규격.
Intelligent Computer Solutions (ICS)
Solo-4를 제조·판매하는 미국 기업.
iOS
iPhone, iPad, iPod touch 등, 애플의 모바일 단말에 탑재되고 있는 OS.동사의 PC, 매킨토시용 OS 「Mac OS X(텐)」를 베이스로 개발되었다.터치 패널을 전제로 한 유저 인터페이스가 특징.
J
주피터 수첩
Python을 포함한 프로그램 코드와 수식, 다이어그램, 설명문 등을 포함하는 문서를 작성하고 공유할 수 있는 웹 애플리케이션.
K
KIBIT
FRONTEO의 AI의 명칭.읽기는 "키빗".일본어의 “기미”(KIBI)와 정보량의 최소 단위 “비트”(BIT)의 조합으로 인간의 기미를 이해하는 인공지능”이라는 의미의 조어.정답, 부정해라는 라벨로 분류된 텍스트 데이터를 사용하여 교사 있어 학습을 실시해, 텍스트에 포함되는 특징(형태소)으로부터 자동으로 정답 라벨의 공통점을 찾아내는 것이 가능.
KIBIT Email Auditor
메일 감사 도구.정보 유출이나 카르텔의 징후의 발견 등에 이용된다.
KIBIT Find Answer
FAQ 도구.자연문에 입력된 질문의 특징을 학습함으로써 과거의 유사한 질문을 추출하고 전문가의 답변 데이터를 신속하게 제시할 수 있다.
KIBIT G2
독자 개발의 인공 지능 엔진 「KIBIT(키비트)」를 강화해, 인공 지능(AI) 실장의 범용성을 높인 차세대판의 인공 지능 엔진.읽기 "키비트 지 투".
KIBIT Knowledge Probe
일반 텍스트 데이터를 분석하는 비즈니스 데이터 분석 지원 도구.영업일보나 고객으로부터의 문의 등의 텍스트 데이터를 해석한다.
KIBIT Patent Explorer
특허 조사 도구.복잡한 검색식의 수립이 불필요하기 때문에, 조사의 효율화를 도모할 수 있다.일미 특허공보 데이터베이스를 탑재하고 있다.
KIBIT-Connect
KIBIT G2 및 외부 시스템과의 연계를 용이하게 하는 웹 API.문장 데이터의 등록이나 교사 데이터의 작성, 해석 결과가 되는 스코어링의 제공 등, KIBIT-Connect를 통한 데이터의 수수를 심리스하게 실시할 수 있다.
L
LBA(Logical Block Addressing)
하드 디스크 내의 데이터 위치를 나타내는 방법의 하나로, 하드 디스크의 모든 섹터에 일련 번호를 흔들어, 그 번호에 의해 섹터를 지정하는 방식.
Linux
리너스 토벌즈가 개발한 UNIX 호환 OS.무료로 이용할 수 있는 오픈 소스로 제공되고 있으며, 전세계의 개발자나 유저에 의해 개량이 더해져, 많은 디스트리뷰션이 등장하고 있다.
Lit i View XAMINER /Lit i View E-Discovery
각 데이터의 검색이나 리뷰 등이 가능한 소프트웨어. FRONTEO의 독자 개발.인공지능 관련 기술을 통해 문서의 점수를 매길 수 있으므로 대량의 문서를 효율적으로 검토하는 데 적합하다.많은 메일 타입의 처리가 가능하고, 일본 특유의 메일 소프트에의 대응력이 높고, 일본어·중국어·한국어의 아시아 언어의 해석에 강하다.또한 Central Linkage 기능에 의해 조사 대상자의 상관도를 알기 쉽게 표시할 수 있다.
※자사 제품
M
맥 OS
Apple사의 Macintosh에 탑재되고 있는 OS.
MacQuisition
Black Bag사가 제공하는, Mac에 대응하는 이미지 파일 작성 툴. FTK Imager와 같이 기동한 머신에서의 데이터 취득도 가능.
MBR(Master Boot Record)
컴퓨터가 시작될 때 처음으로 로드되는 하드 디스크의 첫 번째 섹터의 영역입니다. Windows OS나 프로그램이 기동해 조작 가능하게 될 때까지의 흐름으로서는, 「PC전원 ON→BIOS 스타트→MBR 불러오기→부트 로더(OS를 HDD로부터 읽어들여 기동하는 프로그램) 불러오기→OS 기동」이 되어 있다.
MFT(Master File Table)
NTFS로 포맷된 각 파티션에 대해 작성된 시스템 파일 중 하나.파티션에 기록된 데이터의 관리 정보 모음.
Micro Systemation (MSAB)
MSAB Office를 제조·판매하는 스웨덴 기업.
MSAB Office/XRY/XAMN
스마트폰 등, 휴대 단말의 데이터를 추출, 해석을 할 수 있는 소프트웨어. XRY(데이터 추출 도구), XAMN(데이터 분석 도구)
XRY로 추출한 데이터는 자동으로 암호화되어 암호화된 데이터를 분석하기 위해서는 XAMN을 사용할 필요가 있다.다른 분석 도구에서는 데이터를 확인할 수 없기 때문에 데이터를 수정할 수 없습니다.세계 100개국 이상의 경찰이나 법집행기관에서 사용되고 있다.
※자사 취급 제품
N
NAS (Network Attached Storage)
네트워크에 직접 연결하여 사용하는 파일 서버.케이스 크기가 비교적 작고 가격대도 풍부하고 용량도 몇 TB(테라바이트)의 것이 있다.
NTFS(NT File System)
Microsoft사의 OS인 Windows NT계가 표준 채용하고 있는, 저널링 파일 시스템. Microsoft에서는 NT File System으로 하고 있지만, New Technology File System이라고 불리기도 한다.
O
OS
컴퓨터에서 하드웨어를 추상화한 인터페이스를 각 애플리케이션에 제공하는 소프트웨어.
P
PRTK
암호 분석 도구.
Python
데이터 과학에서 인기있는 프로그래밍 언어.간결하고 읽기 쉬운 문법이 특징적.웹, 데이터베이스, 네트워크, 병렬 처리 등의 응용에서 대규모 데이터 처리까지 가능합니다.
R
RAID (Redundant Arrays of Inexpensive Disks)
복수의 하드 디스크(HDD)를 조합해 1대의 하드 디스크로서 관리·운용을 하는 기술이며, 액세스 속도의 고속화나 안전성의 향상 등 중복성의 확보를 목적으로 한 구조를 가리킨다.실현 방법으로서는, 전용의 하드웨어를 사용하는 것과 소프트웨어를 사용하는 것을 들 수 있다.
RAID는 그 기능에 따라 종류가 나뉘어 있으며, 「RAID0」에서 「RAID6」까지의 7종류가 존재하지만, 「RAID0」과 「RAID1」을 조합한 「RAID01」이나 「RAID10」등의 종류도 존재한다.
· 「RAID0」은 복수의 HDD에 균등하게 데이터를 각각 나누어 가고, 동시 병행으로 기록을 행한다. 「스트라이핑」이라고도 불리는 경우도 있다. HDD가 1대 망가진 경우는 데이터가 손실되기 때문에, 「RAID0」에는 중복성은 없다.
・「RAID1」은 2대의 HDD에 완전히 동일한 데이터를 동시에 기록한다. 「미러링」이라고 불리는 경우도 있다.정확히 같은 데이터를 가진 HDD가 2장 만들어지므로 중복성이 확보된다.
· 「RAID2」는 데이터 이외에 에러 수정용 코드도 별도로 기록한다.최소 구성의 경우에도 데이터용으로 2대, 수정 코드용으로 3대의 HDD를 각각 필요로 한다.수정용 코드에 의해, 데이터용의 HDD가 망가져도 데이터를 복구할 수 있는 구조로 되어 있어, 중복성이 확보된다.
· 「RAID3」은 데이터 이외에 데이터 복구를 위한 정보(패리티)도 별도로 기록한다.데이터 복구를 위한 정보를 하나 이상의 HDD에 기록하고 합계로 최소 1대 이상의 HDD를 사용한다.패리티는 중복성을 보장합니다.
· 「RAID4」는 「스트라이핑」방식으로 데이터를 기록함과 동시에 패리티도 별도 기록한다.데이터 복구를 위한 정보를 하나 이상의 HDD에 기록하고 합계로 최소 1대 이상의 HDD를 사용한다.패리티는 중복성을 보장합니다.
・「RAID5」는, 최소 3대 이상의 HDD를 사용해, 균등하게 데이터를 각각 배분해 간다.하드 디스크가 1대 고장해도, 남은 디스크로부터 데이터를 복구할 수 있기 때문에, 중복성이 확보된다.
・「RAID6」는, 「RAID5」와 같이, 동시에 최저 3대 이상의 HDD를 사용해, 균등하게 데이터를 각각 배분해 나가지만, 하드 디스크가 2대 고장해도, 남은 디스크로부터 원의 데이터를 복구 할 수 있기 때문에 중복성이 보장됩니다.
RECON IMAGER
SUMURI 사가 제공하는 Mac에 대응하는 이미지 파일 작성 툴.메모리 정보의 취득도 가능하다.
RECON LAB
SUMURI 사가 제공하는 Mac에 대응하는 이미지 파일 해석 툴.메모리 정보의 분석도 가능하다.
참고 문헌 (Resilient File System)
Windows 2012년에 도입된 재해 복구가 뛰어난 파일 시스템.
레지스트리 뷰어
레지스트리 분석 도구.
S
SATA (Serial ATA)
컴퓨터와 하드 디스크나 광학 드라이브 등의 기억 장치를 접속하는 IDE(ATA) 규격의 확장 사양의 하나.
SCSI (Small Computer System Interface)
컴퓨터 본체에 저장장치(외부 기억장치) 등의 주변기기를 연결하여 통신하기 위한 접속 방식의 표준 규격 중 하나.
Solo-4
HDD나 USB의 데이터 복사, 데이터 소거를 할 수 있는 하드웨어. 1대 2, 2대 1, 1대 2×4 계통의 카피가 가능하고, 소거 방식은 DoD 와이프에도 대응. Windows OS를 탑재해 컴퓨터로서 사용하는 것도 가능. FRONTEO의 Solo-XNUMX에는 FTK Imager도 탑재되어 있다.
SSD (솔리드 스테이트 드라이브)
대용량 플래시 메모리로 구성된 디스크 드라이브.솔리드 스테이트 드라이브(Solid State Drive)의 머리글자를 취한 것으로, 실리콘 디스크라고도 불린다.저소비 전력으로 가벼운 데다가, 고장하기 어렵기 때문에, 경량인 모바일·PC나 태블릿형 PC로 채용되고 있다.
SUMURI
Mackintosh의 보전·해석 툴인 RECON IMAGER·RECON LAB를 제조·판매하는 기업.
T
TAR (Technology Assisted Review)
Predictive Coding, 클러스터링, 이메일 스레딩 등의 효율적인 검토를 수행하는 기술의 총칭. FRONTEO는 독자 개발한 인공지능 'KIBIT(키비트)'에 의한 Predictive Coding을 강점으로 하여 리뷰의 효율화와 비용 절감을 도모하고 있다.
TF(Term Frequency)
해석 대상의 문서군 중, 그 형태소가 몇 번 출현했는지를 나타낸다.
UNIX AT&T사(미국)의 벨 연구소에서 개발된 OS의 하나.유지나 벤더에 의해 개발이 계속되고 있다.
U
USB 메모리
컴퓨터의 USB(Universal Serial Bus) 단자에 연결하여 사용하는 플래시 메모리를 내장한 외부 기억 매체의 총칭을 가리킨다.전송 속도가 규격에 따라 다르며 세대마다 전송 속도가 다르다.
USB 1.0 : 12 Mbps의
USB 1.1 : 12 Mbps의
USB 2.0 : 480 Mbps의
USB 3.0 : 5Gbps
USB 3.1 : 10Gbps
※ 상기의 수치는 모두 「최대 데이터 전송 속도」
규격에 따른 전송 속도의 차이에 따라 데이터 복사 속도가 다르기 때문에 소프트웨어 기반으로 증거 보전을 수행하는 경우 보전에 필요한 시간이 크게 다를 수 있습니다.
기밀 데이터의 반출(정보 유출) 사안에 대해서는, 여전히 USB 메모리가 유출 경로로서 이용되는 경우도 많고, USB 메모리 등 외부 기록 장치의 접속 이력 조사는 유효한 조사 수법의 하나가 되고 있다.
W
Windows
Microsoft사의 OS.
윈도우 9x
Windows 95/98/98 SE/Me의 총칭으로, 기본 설계는 Windows 95의 것을 계승한다.
윈도우 NT
Windows NT의 기본 설계를 바탕으로 제작된 OS의 총칭.서버, 워크스테이션용으로 개발된 OS. Windows 9x계에 대해 많은 부분에서 상위 호환성을 가지지만, 구조는 완전히 다른 OS.
닦음
단어의 의미로는 닦아내고, 닦아내고, 지우고, 지우는 등의 의미를 가지고 있다.디지털 법의학에서 Wipe는 Wipe-out (데이터 소거)을 의미하며 데이터 소거 방법에는 다음과 같은 세 가지 점이 있습니다.
1. 소프트웨어 방식:기록 매체에 특정의 숫자나 문자등을 기입한다
【메리트】
· HDD 재사용 가능
【단점】
・ 제로, 난수, NSA(미국 국가 안보국), NATO(북대서양 조약 기구), Gutmann(구트만) 등 방식이 다수 있다
· 데이터 복원 가능성을 고려하면 여러 번 쓰기 (덮어 쓰기)가 권장되지만 처리 시간이 필요합니다.
2. 자기 파괴 방식 : 기록 매체에 강력한 자기를 조사하여 기기 자체를 전자적으로 파괴한다
【메리트】
· 기록 매체의 용량, 인터페이스, OS에 의존하지 않음
【단점】
· HDD 재사용 및 육안 확인 불가
3. 물리 파괴 방식~기록 매체에 구멍 등을 열어 물리적으로 파괴한다
【메리트】
· 기록 매체의 용량, 인터페이스, OS에 의존하지 않음
【단점】
・HDD의 재이용은 불가, 파손되어 있지 않은 개소에 데이터가 남는다
Wipe의 예는 증거 보전 준비 단계에서 데이터 복사 대상 HDD의 사전 Wipe를 포함합니다.이 작업은 위생이라고 불리며 복사 대상 HDD의 미세한 데이터를 잔류시키지 않고 증거 보전 데이터와의 일체의 혼재를 피할 목적으로 실시한다.또, HDD의 잔류 데이터를 원인으로 하는 정보 유출을 막는 것이 목적의 경우, Wipe를 적절하게 실시할 수 있었는지의 확인은 필수라고 할 수 있다.
Z
Z- 점수
편차 값의 일종.표본의 평균과 모집단의 평균이 통계적으로 볼 때 유의미하게 다른지 여부를 측정하는 지표. Z-Score가 양수라면 표본의 평균은 모집단의 평균보다 유의하게 높다고 할 수 있다. KIBIT의 복수의 학습 결과를 비교할 때에 이용한다.
아
아토니 매니저(Attorney Manager)
변호사 자격을 가진 리뷰 관리자로, 대리인의 변호사와 커뮤니케이션을 취해 레뷰워로부터의 질문에 회답함으로써 리뷰의 품질을 담보한다.
암묵지(Tacit knowledge)
단어 등으로 표현하기 어려운 경험이나 감에 기초한 지식.
이미징(이미징)
제출용 파일을 페이지로 TIFF 형식 또는 PDF 형식으로 변환합니다.
인시던트 응답
인시던트·리스폰스란, 정보 시스템 등에 있어서의 사고(인시던트)가 발생한 후의 조치, 대응을 말한다.정보 보안 분야의 사고 (인시던트)는 정보 시스템 등 전반에 대한 위협이되는 사건을 말하며, 보안 인시던트라고도 불린다.
최근의 인시던트는, 부정 액세스나 시스템 장애 등 시스템을 주안으로 한 것뿐만 아니라, 분식 결산이나 인사이더 거래, 은폐 공작 등, 모랄 해저드에 있어서의 인시던트도 인시던트·리스폰스의 대상으로 하고 있다.
기업 활동 등에서 정보 시스템 등에서 사고 (인시던트)가 발생하면 기업 가치의 저하로 이어질 우려가있다.데이터의 손실이나 서비스의 저하, 기업 가치의 저하 등 리스크를 억제, 극소화해, 데미지 컨트롤을 실시하는 것이 인시던트·리스폰스의 하나의 목적이다.
인시던트·리스폰스는, 얼마나 빠른 단계에서 인시던트에 대해 파악해, 「신속」 「적확」 「원활」에 초동 대응을 취하는 것이 중요하다.적절한 초동 대응, 조사를 실시하기 위해서는, 평시에 인시던트 발생시의 대응 순서, 체제의 구축을 정돈해, 정기적으로 훈련을 실시하는 것이 중요하다.
인시던트 발생시의 조사에 있어서, 준비·체제 구축이 되어 있지 않은, 문제 해결을 위한 프로세스를 모른다고 하는 경우도 있다.또한, 조사의 신뢰성, 신빙성 등의 관점에서도 제XNUMX자적 입장인 조사회사 등에 의뢰하는 것이 유효하다.이에 따라 실제로 조사를 실시하는 디지털 포렌식 조사회사의 선정도 중요한 포인트가 된다.가격뿐만 아니라 경험·품질을 포함한 종합적 능력을 바탕으로 결정해야 한다.
イ ン タ ビ ュ ー(인터뷰)
소송 대상자(Custodian)에 대하여 변호사나 법무·지재부가 청취 조사를 실시하는 것.
인터페이스 (Interface)
「경계」나 「접점」을 나타내는 말이며, IT의 분야에 있어서는, 주로 「하드웨어끼리의 접점, 혹은 접점이 되는 기기류나 프로그램」을 의미한다.구체적으로는, 컴퓨터와 그 주변 기기 등, 하드웨어 간의 통신을 행할 때에 필요한 물리적 접속의 형상이나 사양을 말한다.
인터페이스는, 그 정보 통신의 방식에 의해 2종류로 나눌 수 있고, 데이터를 1비트씩 순차적으로 송신하는 「시리얼 인터페이스」와 데이터를 한 번에 복수 비트 송신하는 「병렬 인터페이스」가 있다.
전자에 해당하는 규격으로서는 「SATA」(Serial Advanced Technology Attachment)나 「IEEE 1394」등이, 후자에 해당하는 규격으로서는 「SCSI」(Small Computer System Interface)나 「IDE」(Integrated Drive Electronics) , 「ATA」(Advanced Technology Attachment) 등을 들 수 있다.
인터페이스는 증거 보전의 데이터 복사 여부와 속도를 좌우하는 중요한 유의 사항 중 하나입니다.예를 들면, HDD로부터 직접 데이터를 복사하는 경우, 인터페이스에 따라 접속 형식이 다르기 때문에, 각 규격에 따른 접속 케이블을 사전에 준비해 둘 필요가 있다.또한, 데이터 카피의 속도는 인터페이스에 의해 좌우되기 때문에, 각 규격의 데이터의 전송 속도도 파악해 두는 것이 바람직하다.
색인(Indexing)
【광의】 툴(Lit i View)상에서 검색(Search)을 원활하게 실시하기 위한 인덱스를 작성하는 것. (※주: 문서에 고유 번호(Doc. ID) 부여 및 메타 정보 추출)
【협의】Text Extraction 후에 Indexing 데이터베이스를 작성해, 키워드 검색(Search)을 가능한 상태로 하는 것.
브라우징/리뷰(Review)
수집, 처리, 분석을 거친 전자 데이터에 대해서, FRONTEO 검토자나 법무·지재 담당자, 변호사가 소송과 관련된 내용인지 육안으로 확인할 것.
엔드 스먼트(Endorsement)
일련 번호나 정보의 기밀성의 레벨을 파일에 각인하는 것.
하나
쓰기 방지 장치
HDD 등의 기록 매체에 데이터 기입을 저지하는 장치;
포렌식 조사에서는 증거 데이터의 무결성과 원성을 유지하기 위해 조사·해석 대상이 되는 데이터에 액세스할 때는 읽기 전용(ReadOnly)으로 액세스하여 데이터의 쓰기를 막아야 한다.기록 방지 장치는 HDD 등의 기록 매체에 대하여 일체의 데이터의 기록을 무효로 할 수 있기 때문에, 데이터의 변경을 회피하고, 안전한 데이터 열람이 가능해진다.
확장자
이 파일이 어떤 파일인지, 어떤 응용 프로그램에서 열 수 있는지 식별하기 위해 파일 이름 끝에 부여 된 문자열이 확장자입니다.
파일명의 말미의 " . "(마침표) 이후의 문자가 확장자이며, Windows OS는 확장자를 기초로 파일의 종류를 판별하고 있다.확장자의 예로는 ".xls"(엑셀 서류), ".jpg"(jpeg 이미지), ".pdf"(PDF 서류) 등이 있다.
Windows의 초기설정에서는 확장자는 숨기기로 설정되어 있으므로 참조하기 위해서는 설정변경이 필요하다.
부정 사건에서는 증거가 되는 데이터의 확장자를 변경하여 은폐하는 경우 등이 있다. (워드 파일 ".doc"의 확장자를 변경하여 이미지 파일 ".jpg"로 설정 등)
또, 컴퓨터 바이러스중에는 확장자의 보이는 방법을 위장하는 것으로 유저를 속여, 바이러스 파일을 실행시키려고 하는 것도 있어, 확장자를 표시하지 않는 설정의 경우, 바이러스가 들어간 실행 파일” Sample.txt.exe는 "Sample.txt"로 표시되므로 사용자는 단순한 텍스트 파일이라고 생각하고 실행할 수 있습니다.
과징금 감면 제도(Leniency)
스스로가 관련된 담합행위(카르텔) 등의 독점금지법 위반 행위를 범한 경우에 통보자로서 공정거래위원회에 위반 사실을 자주 신청·보고함으로써 처벌이 경감되는 제도 .
개념 증명(PoC: Proof of Concept)
실증 실험.제품을 생산하기 전에 고객의 데이터를 사용하여 제품의 유효성을 조사 / 검증합니다.
쓰기 방지 장치
법의학 조사에서 중요한 증거 데이터의 기본성과 무결성을 유지하기 위해 데이터 쓰기를 방지할 수 있는 도구.접속된 HDD나 USB 인터페이스 디바이스 등, 다양한 규격의 미디어에 대해서, 데이터의 기입을 일절 무효로 한다.
※자사 취급 제품
확장 파티션(extended partition)
하드 디스크를 몇 개로 단락지은 파티션 중, 기본 영역 이외의 DOS 파티션.
카스토디안(Custodian)
관련 데이터 및 문서 보유자.정보 공개의 대상이 된다.
컬링(Culling)
법정 제출이나 변호사에 의한 검토 전에 불필요한 파일(시스템 파일 등)을 제외하고 일정한 파일을 선별하는 것. FRONTEO에서는 EnCase를 이용하여 필요한 데이터(User가 작성한 파일)만을 추출한다.
저장 장치(메모리)
5대 장치 중 하나.컴퓨터 내부의 메인 메모리를 주 기억 장치라고 부르고, CPU가 직접 교환하는 기억 장치로, 컴퓨터 전원이 꺼지면 정보는 소실된다.주 기억 장치에 대하여, 전원이 꺼져도 데이터 소실이 일어나지 않는 하드 디스크나 USB 메모리 등의 기록 매체를 보조 기억 장치(1차 기억 장치)라고 부르고, 유저나 OS에 의해 작성된 데이터가 기록된다 .
기계 학습(Machine Learning)
데이터에서 반복적으로 학습하고 거기에 숨어있는 패턴을 찾습니다.그리고 학습한 결과를 새로운 데이터에 맞추는 것으로, 패턴에 따라서 장래를 예측하는 것이 가능하게 된다.사람의 프로그래밍으로 구현하고 있던 알고리즘을 대량의 데이터로부터 자동적으로 구축 가능하게 되기 때문에 다양한 분야에서 응용되고 있다.기계 학습을 수행 할 때, 학습하기 쉽도록 인간이 데이터에서 매개 변수를 미리 조정할 필요가있었습니다.그러나, 그 파라미터 조정조차도 자동으로 행하는 것이 최근에 가능해지고있다.
교사 있음/교사 없음 학습(Supervised Learning/Unsupervised Learning)
컴퓨터에 대하여, 입력(질문)과 출력(답)의 쌍으로 이루어지는 훈련 데이터를 이용하여, 그 뒤에 숨어 있는 입출력 관계(함수)를 학습시키는 방법을 「교사 있어 학습」이라고 부른다.한편, 출력(답)이 없는 입력 데이터만으로부터 학습시키는 방법을 「교사 없음 학습」이라고 부른다.예를 들어, 입력 데이터가 유사한 사람들을 그룹화하는 클러스터링이 전형적인 예이다.
교사 데이터/훈련 데이터(Training Data)
교사가 있는 학습으로 컴퓨터가 데이터를 분류하는 방법을 학습하도록 하는 데이터. KIBIT의 교사 데이터는 HOT(발견하고 싶은 데이터), NOT HOT(발견하고 싶지 않은 데이터)의 XNUMX종류의 분류 라벨을 부여한 데이터로 이루어진다.
업무 사양서/스코프 오브 워크(SOW: Scope of Work)
보전 범위의 선정 등, 안건에 필요한 작업 범위를 정해, 적은 서면. (※주:Process의 단계에서도, Process의 각종 조건(Dedup의 종류 등)을 나타내기 위해서 이 문서가 사용된다.)
클라이언트 서버 방식(client-server system)
많은 정보를 갖는 서버와 클라이언트 컴퓨터를 네트워크로 연결함으로써, 클라이언트 컴퓨터의 요구에 따라 서버가 정보 및 기능을 제공하는 시스템.예를 들어 컴퓨터와 NAS를 네트워크로 연결하면 NAS에서 필요한 파일을 다운로드 할 수 있습니다.
클러스터(cluster)
클러스터는 OS가 관리하는 데이터의 최소 단위를 의미합니다.데이터 기입의 최소 단위인 섹터를 몇 개 모은 것으로, 섹터의 개수나 사이즈는 OS나 파일 시스템에 의해 다르다.클러스터 단위로 OS가 관리하는 이유로서, 데이터 기입의 최소 단위인 섹터 단위에서는 읽기/쓰기 등에 시간이 걸리고, 효율이 나빠지기 때문에 섹터를 일정 수 정리해 클러스터로서 취급함으로써 효율화를 도모하고 있다.
예를 들어, 클러스터 사이즈가 4K바이트(4,096바이트)로 관리하고 있는 경우, 1K바이트의 데이터를 그 OS상에서 기입하면 디스크상의 사이즈는 4K바이트(4,096바이트)로 표시된다.이는 데이터 자체는 1K바이트이지만, OS가 관리하는 데이터의 최소 단위가 4K바이트(4,096바이트)이기 때문에 그만큼의 영역을 사용한 것을 의미한다.또한,이 데이터를 기록하지 않은 여분의 영역을 슬랙 스페이스라고 부른다.디지털 법의학에서이 슬랙 공간에 남아있는 잔여 데이터는 복원 및 분석에 사용될 수 있습니다.
클러스터링(클러스터링)
특징이 유사한 것마다 데이터를 분류하는 수법 전반을 나타낸다.데이터만 보고 분류하는 교사 없음 Clustering, 라벨을 참고로 데이터를 분류하는 클래스 분류로 대별된다.
원고(Plaintiff)
소송에서 호소를 제기한 당사자.
광학 문자 인식(OCR: Optical Character Recognition)
필기 문자나 인쇄된 문자를 읽고, 데이터와 조명 문자를 판단하고, 전자 텍스트화하는 장치.텍스트를 보관 유지하지 않는 파일은 Text Extraction 할 수 없기 때문에, OCR에 의해 텍스트화하는 일도 있다.
형식 지식(Explicit knowledge)
문장이나 도표, 수식 등에 의해 설명·표현할 수 있는 지식.
형태소(morpheme)
의미가 있는 최소 단어 단위. ←의 설명을 형태소로 분해한 예로서, 「의미/를/가는/최소/의/말/의/단위」가 생각된다(분해에 사용하는 사전, 수법에 의해 결과가 다르다).
사례 연구 시트(CSS: Case Study Sheet)
프로젝트와 관련된 데이터의 위치, 보존 방법, 보존 날짜 및 시간 등이 설명됩니다.
언어 특정(Language Detection)
각 문서에 사용되는 언어(또는 그 비율)를 식별합니다.
코딩(코딩)
태그.각 데이터에, 그 데이터가 소송 관련 문서인지 아닌지, 또한, 어떠한 사항에 관계 있는 문서인가등의 정보를 부가하기 위해서, 증거 열람 시스템(FRONTEO에서는 Lit i View)상에서 판별용 태그를 추가하는 것.
컴퓨터의 5대 장비
컴퓨터는 다양한 파트의 조합으로 구성되지만, 각 기능을 5개로 분류했을 때의 호칭.제어 장치, 연산 장치, 주·보조 기억 장치, 입력 장치, 출력 장치.
말이야
서버(server)
네트워크 상에 설치되고 사용자(클라이언트 컴퓨터)로부터의 요청에 대한 서비스 기능 및 데이터를 제공하는 컴퓨터.
회수율(Recall Rate)
평가 데이터군 중에서 꺼내고 싶은 정답 데이터 중, 실제로 꺼낼 수 있는 비율.포괄성에 대한 지표. KIBIT의 학습 결과를 평가하기 위해 이용한다.
제작/제작(Production)
브라우징/리뷰에서 소송과 관련된 것으로 분류된 전자 데이터를 법원에 제출하기 위한 형식으로 변환하는 것.
사실 심리(Trial)
디스커버리나 약식 판결(Summary Judgment)로 결착이 붙지 않는 경우에 공개의 법정에서 행해지는 심리.
수집(Collection)
대상이 되는 모든 전자 데이터를 수집하는 것. (종이에 밖에 남지 않은 정보를 스캔에 의해 전자화하여 수집하는 경우도 있다.) 데이터의 복제를 행한다. (※주:FRONTEO에서는 EDRM에서 말하는 Collection(수집)을 「증거 보전」이라고 부르고 있다)
소환장(Subpoena)
법원에 출두를 촉구하기 위해 발행되는 명령서.
증언 기록(Deposition)
법정외에서 변호사 동반하에 증인에게 심문을 하고 내용을 기록하는 것.
증거 공개(Discovery)
미국 민사소송에 있어서의 「심리」전에, 원고·피고 쌍방이 소송에 관계하는 증거를 개시하는 수속.비록 미국의 자회사가 소송 대상이 된 경우에도 일본 본사의 데이터도 증거 공개의 대상이 된다.
정보공시지원업체(Discovery Vendor)
검색을 지원하는 업체. FRONTEO도 정보공시 지원업체 중 하나.
정보 관리(Information Governance)
기업이 실시하고 있는 전자 데이터의 분류·격납 등의 평시에 있어서의 정보 관리. FRONTEO에서는 Email Auditor의 아카이브 기능으로 사용되고 있다.
증거보전 (Preservation of evidence)
일반적으로 민사소송이나 형사소송의 재판 등에 이용하는 증거를 확보하는 것을 말한다.
디지털 포렌식에서 증거 보전은 주로 대상 PC 내의 HDD 등의 데이터를 전혀 재기록하지 않고 완전한 복제(HDD 등의 전체 영역의 복사)를 취득하는 작업을 말한다.
적절하게 증거보전된 복제에는 원본과 유사한 증거로서의 가치가 인정될 수 있지만, 그러기 위해서는 증거보전작업의 신빙성 및 원본과 복제의 정보의 동일성 등이 확보되어 있어야 한다.
작업의 신빙성을 담보하기 위해서는, 「작업 순서의 기록을 서류에 남긴다」 「작업 상황을 카메라·비디오로 촬영한다」등의 기록화가 필요하고 있어, 원본과 복제의 데이터의 동일 성을 담보하기 위해서는 원본 HDD와 복제 HDD의 해시값을 구하여 산출된 해시값의 비교에 의한 동일성 검증이 필요하며, 모두 객관성과 제XNUMX자 재현성에 배의했다 작업이 이루어져야 한다.
처리/프로세스(프로세싱)
수집한 전자 데이터의 분석이나 열람을 실시하기 위해, 이메일 등의 압축 파일의 전개나, 텍스트, 메타데이터의 추출을 실시하는 사전 처리.
실린더(Cylinder)
하드 디스크의 기록 단위 중 하나.플래터 상에서, 데이터는 동심의 트랙으로 분할된 섹터에 기록되지만, 트랙의 원통형 모음을 실린더라고 한다.
인공지능(AI: Artificial Intelligence)
인공적으로 인간의 지능을 기계로 실현시키는 기술의 총칭. '인공지능' 자체, 매우 넓은 개념이며 추상도가 높다.아직도 그 정의가 연구 테마가 되고 있다.인간이 자연스럽게 하고 있는 학습 능력과 같은 기능을 컴퓨터로 실현하려고 하는 기술·수법의 총칭이며, FRONTEO의 인공 지능 기술 Landscaping이나 Deep Learning이라는 기술은 그 대표.
잉크 그리기(Redaction)
비밀 특권(Privilege)이나 기밀 정보를 부분적으로 묵도하는 처리.
제재(Sanction)
검색에서 데이터를 제시할 수 없으면 벌금과 같은 법적 조치가 취해집니다.
두 번째 검토(2nd Review)
1st 리뷰 후 수행, 더 고급 리뷰.변호사나 패러리갈이 소송에 관계하는 자료인지 아닌지를 배분한다.비밀 특권(Privilege)의 체크도 실시한다.
섹터(Sector)
디스크(디스크) 형태의 기록 장치에서의 데이터의 최소 기록 단위.
디스크 형 디스크의 표면에는 동심으로 분할 된 트랙이라 불리는 영역이 있고, 그 트랙을 일부로 분할하여 부채꼴이되는 부분을 섹터라고 부른다.섹터의 크기는 파일 시스템 등에 따라 다르지만, NTFS는 일반적으로 1 섹터 512 바이트로되어있다.또한 최근 하드 디스크의 대용량화에 따라 4K 섹터(1섹터 4096바이트)의 것도 등장하고 있다.
섹터는 데이터 쓰기의 최소 단위이지만 파일 시스템에서 데이터를 관리하는 최소 단위는이 섹터의 여러 집합 인 클러스터라고하는 단위입니다. NTFS의 클러스터 사이즈는, 일반적으로 4,096바이트이며, 8섹터분의 영역이 된다.섹터 단위로 관리하지 않는 이유는 OS가 섹터 단위로 데이터를 읽고 쓰면 효율이 나빠지기 때문입니다.
디지털 법의학에서 섹터 크기와 클러스터 크기에서 슬랙 공간의 잔여 데이터를 조사 할 수 있습니다.
소송 지원(Litigation Support)
IT 전문가를 변호사 사무소 내에 설치하고 법률 기술을 이용하는 체제.
조기 사례 평가(ECA: Early Case Assessment)
소송에서 기소하거나 변호하기 위해 위험(시간 및 금전적 비용)을 추정한다.
한
제XNUMX자 위원회 (Third-party panel)
제XNUMX자위원회란 대립관계에 있는 당사자와는 직접적인 이해관계를 갖지 않는 중립적인 제XNUMX자로 구성된 조사위원회를 말한다.여론에 큰 영향을 미치는 불상사나 사실규명이 필요한 사안이 발생했을 때 설치된다.
제XNUMX자 위원회는 사안의 원인을 밝히고 재발 방지책에 제언을 하기 위해 전문적 지견을 갖춘 멤버 팀으로 구성되어 있다.
기업이나 관공청이 가지는 정보의 대부분은 전자 파일이나 메일 등의 전자 데이터이기 때문에, 어떠한 불상사가 발생했을 경우, 이들 전자 데이터의 해석이 필요하게 되는 경우가 있다.그러나 전자 데이터는 휘발성이 높고 변경도 용이하기 때문에 증거성을 잃지 않고 조사 및 해석을 수행하기 위해서는 디지털 포렌식에 관한 높은 기술이 필요하다.
최근, 제XNUMX자 위원회에서의 전자 데이터의 조사는 증가하고 있고, 포렌식 벤더가 제XNUMX자 위원회 또는 제XNUMX자 위원회의 전자적 해석 부분의 보조로서 참가해, 원인의 해명 및 객관적 사실을 기재된 보고서를 작성할 기회가 증가하고 있다.
체인 오브 캐스트 디 / 증거의 연속성(CoC: Chain of Custody)
보관의 연속성을 증명하는 서면. FRONTEO에서는 대상의 데이터를 “언제, 누가, 누구로부터, 어느 HDD에 카피해 가지고 돌아왔는지를 기록해, 보관의 연속성을 증명하고 있다. 이 서류는, 데이터 보전 후에 고객에게 확인·서명해 주셔, 보관한다.
중복 삭제(De-duplication, Dedup)
여러 캐스트디안에서 동일한 이메일을 받은 경우 캐스트디언에 우선순위를 지정하고 중복 삭제하는 글로벌 데드업과 한 명의 카스트디안 중 파일 유형 및 대상 기기에 우선순위 지정 Dedup하는 Custodian Dedup이 있습니다.중복 삭제를 수행하면 동일한 이메일을 검토 할 필요가 없어져 리뷰 시간을 줄일 수 있습니다.
제안 요청(Request for Proposal)
디스커버리 및 e디스커버리에 필요한 작업 범위를 기재한 자료.업무 사양서(Scope of Work)를 기초로 작성하는 제안서.
내 세우다(Presentation)
공청회나 공판 등의 장소에 EDRM에 따라 작성된 자료를 법적 절차에 따라 제출할 것.
딥 러닝/심층 학습(Deep Learning)
인간의 신경을 모델로 한 다층 구조의 기계 학습 수법이며, 지금까지는 화상이나 음성 등 각각의 데이터의 연구자, 기술자가 수동으로 설정하고 있던 특징량이 자동으로 계산된다.데이터 내부의 크고 작은 다양한 특징을 학습하기 위해 여러 계층의 네트워크 구조가 사용됩니다.그러나, 학습에 걸리는 시간과 학습 데이터의 양은 지금까지보다 훨씬 많이 필요하다.
디스커버리(Discovery)
증거 공개를 참조하십시오.
디렉토리(directory)
데이터나 파일의 저장 장소를 가리키며, Windows에서는 「폴더」라고 불린다.계층 구조(트리 구조)로 디렉토리 작성, 데이터나 파일의 보존이 가능.
데이터 컬렉션 시트(Data Collection Sheet)
데이터 수집(Collection) 후, 보존된 Evidence의 정보를 기재하는 시트.
적합 률(Precision Rate)
인공 지능이 정답 데이터로 추출한 정보에 실제 정답 데이터가 포함되는 비율.정확도에 대한 지표. KIBIT의 학습 결과를 평가하기 위해 이용한다.
텍스트 추출(Text Extraction)
키워드 검색을 위해 실제 데이터에서 텍스트를 추출합니다.
디지털 법의학 (Digital forensics)
디지털 포렌식 연구회에서는 "인시던트, 응답, 법적 분쟁, 소송에 전자기 기록의 증거 보전 및 조사, 분석을 실시함과 동시에 전자 기록의 변조, 훼손 등에 대한 분석, 정보 수집 등을 실시한다. 일련의 과학적 조사 수법·기술”이라고 정의하고 있다. (출처:디지털 포렌식 연구회편『개정판 디지털 포렌식 사전』, 2014년)
또한 컴퓨터 법의학으로 제한하면 조사 대상이되는 HDD 내의 데이터를 전혀 다시 쓰지 않고 완전한 복제 (HDD 전 영역의 복사)를 변조 · 변경이 어려운 형식 (이미지 데이터)으로 작성 (증거 보전)하고, 그 복제한 HDD내의 데이터를 조사·해석하는 것을 가리킨다. OS상에서 소거되고 있지만, HDD내에 데이터가 잔치하고 있는 부분을 복원해, 조사·해석하는 것도 포함된다.
전자증거공개제도(e-Discovery)
미국의 민사 소송에 있어서의 증거 공개(디스커버리) 중, 전자 데이터를 대상으로 한 것. 2006년 12월의 법 개정(FRCP: 「연방민사소송규칙」의 개정)에 의해 개시되어 민사소송의 당사자와 관련된 전자메일이나 도면 등 내부의 전자데이터 공개를 요구하는 미국의 소송제도.
전자 정보 공개 참고 모델(EDRM: Electronic Discovery Reference Model)
국제 표준 e 디스커버리 워크플로우.
전송 정보량/상호 정보량(Transinformation/mutual information)
두 확률 변수의 상호 의존성의 척도를 나타내는 양. KIBIT는 교사 데이터의 TF·DF를 바탕으로 전달 정보량을 계산하여 학습을 실시한다.정답 데이터만, 부정해 데이터만으로 잘 출현하는 형태소일수록 전달 정보량의 값이 높아지고, KIBIT는 정답 데이터에만 잘 출현하는 형태소를 정답의 특징으로서 학습하고 있다.
일련 번호(Bates Number)
지정된 형식으로 변환된 제출용 파일에 번호가 매겨지는 일련 번호.
특정한(Identification)
소송 대상자(Custodian)의 식별과, 관련 정보가 될 수 있는 모든 전자 데이터의 보관 장소를 특정하는 것. FRONTEO는 그 특정 시에 필요한 인터뷰 등에 동석해, 보전 수집 가능 여부의 기술적 견지로 서포트를 하고 있다.
ト ラ ッ ク(Track)
디스크 (디스크) 형태의 기록 장치의 기록 단위 중 하나.하드디스크나 플로피디스크 등의 자기디스크를 이용한 기록매체에서는, 데이터는 나무의 연륜과 같이 동심원으로 분할되어 기록되고, 동심원의 영역을 트랙이라고 부른다.
は
파티션(partition)
하드 디스크의 저장 영역을 논리적으로 분할한 영역.
해시 값(Hash Value)
해시 함수는 임의 길이의 데이터 "x"에서 고정 길이의 데이터 "h (x)"로 변환하는 함수를 의미합니다.이 해시 함수에 의해 구해지는 값을 해시 값이라고 부른다.
해시값은 인간이 말하는 DNA나 지문에 상당하며 매우 높은 고유성을 가지고 있다.법의학 업계는이 해시 값의 동일성으로 데이터 변경이나 변경이 발생하지 않음을 담보합니다.
해시 함수에는 큰 두 가지 특징이 있다.하나는 해시 함수에 의해 구해진 값 “h(x)”로부터 “x”를 역산하는 것은 매우 곤란하다는 점.다른 하나는 "x"가 주어지더라도 "h (x) = h (y)"가되는 "y"를 찾는 것이 어렵다는 것입니다.따라서 해시 함수에 의해 결정된 해시 값은 매우 높은 고유성을 가지며 데이터 동일성을 담보하는 값이 될 수 있습니다.
해시 함수의 대표 예로는 MD5, SHA-1, SHA-256 등이 있지만, MD5는 취약성이 인정되고 있으며, 또한 일본에서는 2013년에 SHA-1의 알고리즘에도 취약성이 있다 로 SHA-1을 전자 정부 권장 암호 목록에서 운영 감시 암호 목록이 들어있다.
MD5는 다른 데이터 A·B로부터 같은 해시값을 산출하는 방법은 나돌고 있지만, 임의의 해시값으로부터 데이터열을 재현하는 것은 용이하게 실시할 수 없기 때문에, 포렌식 업계에서는 현재에도 MD5가 데이터 동일 성 검증에 사용됩니다.
CRC(Cyclic Redundancy Check)는 해시 값의 일종으로 취급될 수 있지만, 에러 검출 코드의 일종이기 때문에 데이터 변조에 대한 내성이 없다.
피고(Defendant)
소송에서 호소된 측의 당사자.
비밀 특권(Privilege)
예로는 기업과 변호사 간의 법률 조언에 대한 커뮤니케이션이 있습니다.검토 단계에서 비밀특권의 대상이 되는 전자 데이터는 제출(Presentation)의 대상에서 반드시 제외되어야 한다.
평가 데이터(Evaluation Data)
학습 결과를 평가하기 위한 데이터군.교사 데이터와는 다른 데이터를 평가 데이터로 설정함으로써 학습 결과의 범용성을 평가할 수 있다.
표준편차(Standard deviation)
데이터의 편차의 크기를 나타내는 지표. (예: 「평균 연수입이 500만엔의 회사」라고 하는 정보만으로는, 특정의 사원의 연수입이 뛰어나고 높은지, 사원의 급료가 평균적으로 500만엔에 가까운지 모른다.표준편차를 이용한다 이를 통해 직원 전체의 연간 수익 범위를 파악할 수 있습니다.)
첫 리뷰(1st Review)
먼저 할 리뷰.많은 리뷰어를 동원해, 대량으로 있는 데이터를 배분해 간다. FRONTEO의 리뷰는이 리뷰가 대부분을 차지합니다.
파일 시스템(파일 시스템)
하드 디스크 등의 기록 매체에 기억되어 있는 데이터를, OS가 효율적으로 관리하는 방식. OS로부터 각종 데이터를 참조, 작성, 삭제 가능하게 하기 위한 구조.
파일 슬랙 공간(file slack space)
데이터가 섹터에 기록되었을 때, 섹터내에서 미사용 부분이 된 스페이스.
부트 섹터(boot sector)
컴퓨터 시작 시 OS를 호출하는 프로그램이 기록된 하드 디스크의 섹터.
포맷(format)
HDD, USB, SD 카드 등의 전자 기억 매체의 「파일 시스템의 식별자」나 「파티션 정보」, 「디렉토리나 파일의 이름이나 구성 정보」등의 관리 정보를 보존하는 영역(이하, 관리 영역)의 초기 값을 기록하고 사용 가능한 상태로 만드는 것을 의미합니다.
사용중인 기억 매체를 포맷하면, 관리 영역이 초기화되기 때문에, 저장된 데이터를 OS상에서 시인 할 수 없게된다.
Windows PC를 이용해 포맷을 실시하는 경우, 관리 영역의 초기화 뿐만이 아니라, 불량 섹터의 진단도 동시에 행해진다.또, 옵션의 「퀵 포맷」을 선택하는 것으로, 불량 섹터의 진단을 실시하지 않고 관리 영역의 초기화만을 실시할 수도 있어, 통상의 포맷에 비해 단시간에 포맷을 완료할 수 있다 할 수 있다.
디지털 포렌식에서는, 포맷에 의해 관리 정보가 초기화된 전자 기억 매체를 조사하는 경우, 포맷이 되어도 데이터 보존이 가능한 영역의 덮어쓰기 등은 행해지지 않는 경우도 있기 때문에, 데이터 보존이 가능 영역에 남아있는 데이터가 있으면 포렌식 도구, 복원 소프트웨어 등을 사용하여 데이터를 복원 할 수 있습니다.
법의 사본 (Forensic copy)
HDD나 USB 메모리 등의 모든 데이터 영역을 복사하는 것을 말한다.
Windows상에서 카피 & 페이스트 등에 의해 파일의 카피를 실시하는 경우, OS로 보이고 있는 현존하는 데이터등은 카피할 수 있어도, 삭제 데이터가 존재할 가능성이 있는 영역이나 미사용 영역은 카피하는 것이 할 수 없다.
한편, 포렌식 복사에서는 전용의 기기나 소프트웨어를 사용함으로써 삭제 데이터 등이 존재할 가능성이 있는 미사용 영역 및 미할당 영역, 데이터 관리 정보 등을 포함한 모든 데이터 영역을 복사 할 수 있다.따라서, 포렌식 카피로 취득한 데이터에 기초하여 삭제 된 데이터를 복원하는 것도 가능하다.
포렌식 카피에는 크게 나누어 2개의 방식이 있다.하나는 완전한 클론을 만드는 '100% 물리 복사'라는 복사, 다른 하나는 대상 데이터를 이미지 파일 형식으로 일정한 용량으로 구분하여 얻는 '이미지 파일 복사'라는 복사 있다.양자는, 외형에서는 다른 데이터로 보이지만, 어디까지나 카피의 형식이 다를 뿐이며, 카피한 결과로서 취득한 내용은 동일하다.
전술한 바와 같이, 포렌식 복사에서는, 통상 취득할 수 없는 삭제된 데이터 영역이나 숨겨진 데이터 영역도 취득할 수 있기 때문에, 보다 많은 정보를 확보할 수 있다.이 점에서 법의학 사본은 "유용성"을 담보한다고 할 수 있습니다.
XNUMX차 파티션(primary partition)
부팅 드라이브로 지정할 수 있는 파티션으로, 1개의 HDD에 4개까지 XNUMX차 파티션을 작성 가능.
플래터(플래터)
하드 디스크 등의 자기 디스크 매체에 수납 된 자성체를 도포 한 디스크 형 부품으로 데이터가 기록되는 부품.재질은 알루미늄, 세라믹, 유리 등이 사용된다.
프리딕티브 코딩(Predictive Coding)
TAR의 일종.인간이 샘플 검토한 결과에 근거해, 데이터의 스코어 붙이는 기능.종래의 인간에 의한 소송 관련 문서의 리뷰를 기계가 강력하게 서포트해, 리뷰 시간의 단축이나 효율화를 도모해, 리뷰 코스트를 억제할 수 있다. (※주: 본 기능은 자사 제품 Lit i View에 탑재되어 있다. 데이터의 스코어는 0점부터 10000점까지 있어, 스코어가 높을수록 관련성이 높은 데이터라고 생각된다)
불량 섹터(Bad Sector)
디스크의 물리적 손상으로 인해 디스크 액세스가 불가능해진 섹터.
분석(Analysis)
전자 데이터에 대하여, 열람의 우선도등을 가미하면서 키워드에 의한 좁히거나 분류를 하는 것.
헤드(head)
플래터의 데이터를 읽고 쓰는 하드 디스크의 작은 부품.플래터의 양면에 데이터가 기록되어 있는 경우에는, 양면 각각에 하나씩 헤드가 탑재된다.
호스팅(호스팅)
프로세스 작업에 의해 추출된 파일은 온라인 증거 브라우징 시스템에 업로드되어 브라우징을 위한 데이터베이스로 구축되어야 한다.
보존(Preservation)
전자 데이터가 부적절하게 변조되거나 파기되지 않도록 보호할 것. (예 : 자사 제품 Lit i View의 Easy Hold 기능 : Custodian에게 Litigation Hold Notice 메일 보내기, 소송과 관련된 설문 조사를 수행하는 기능)
또는
마운트(mount)
주변 장치를 컴퓨터에 인식하고 조작할 수 있도록 합니다.
마자보드(mother board)
컴퓨터 부속 중 하나. CPU나 RAM 모듈 등 다른 부품을 장착하는 기판.
악성코드 (맬웨어)
컴퓨터를 부정하게 동작할 목적으로 작성된 소프트웨어류의 총칭이며, 트로이 목마, 컴퓨터 바이러스, 웜, 애드웨어, 백도어, 스파이웨어 등을 포함한다.
맬웨어의 행동으로는 컴퓨터의 탈취나 데이터의 도난·파괴 등의 악질적인 것부터 브라우저상에서 원하지 않는 광고를 자주 표시하는 것까지 포함된다.
맬웨어 대책으로서는, 방화벽의 설정, 바이러스 대책 소프트의 도입, OS·어플리케이션류를 항상 최신으로 유지하는 것, 메일내의 의심스러운 첨부 파일을 열지 않는, 등이 있다.
디지털 포렌식에서는 감염 유무의 조사, 감염에 의해 부정한 조작이 행해졌는지 등의 조사, 감염 범위의 특정, 감염 경로 조사 등이 있다.
메일 아카이브(메일 아카이브)
전용 저장 영역에 안전하게 메일 데이터를 저장하는 것으로, 하나의 MailArchive에 복수의 이메일 메시지가 저장된다.백업과는 달리 복원하기 위해서가 아니라, 데이터 용량의 경감화나 데이터의 보존을 목적으로 하고 있다.예로는 Outlook의 pst, Outlook Express의 dbx, ThunderBird의 msf 등이 있습니다.
メ タ 情報(메타 데이터)
데이터와 관련된 정보.예로서, 데이터의 「작성 일시」나 「작성자」, 「데이터 형식」, 「타이틀」, 「주석」 등을 들 수 있다. (주 : 여기서 말하는 「작성 일시」는 파일 자신이 관리하고있는 「작성 일시」이며, 파일 시스템이 관리하고있는 「작성 일시」의 정보와는 다르다.
문자 코드(character code)
컴퓨터에서 문자를 표시하기 위해 각 문자에 고유하게 할당 된 번호. 「캐릭터 코드」라고도 불린다. ASCII 코드, 시프트 JIS 코드, 유니코드 등의 체계가 있다.
외
리티게이션 홀드(Litigation Hold)
소송의 발생 시점 또는 소송의 가능성이 판명된 시점에서 부과되는 전자 문서의 보전 의무.기업 내의 문서 관리 규정보다 우선한다.이 보전의무기간 중에 관련 전자문서를 삭제하는 등한 경우에는 증거은멸행위로 간주되어 엄격한 제재조치가 부과된다.
리니언시(Leniency)
과징금 감면 제도를 참조한다.
약식 판결(Summary Judgment) 배심원의 평결을 필요로 하지 않고 법원의 판단에 의해 사실심리(Trial) 전에 소송을 종결시키는 것.
느슨한 파일(Loose file)
MailArchive나 ZIP, LZH등의 압축 파일과 같이 XNUMX개의 파일에 복수의 문서가 굳어져 있는 것이 아니라, 단일 파일이나 단일 메일의 상태로 보관되고 있는 것.
레지스트리(registry)
Windows95 이후의 Windows계 OS에 있어서 이용되는 데이타베이스로, Windows의 기본 정보나 시스템, 어플리케이션 소프트의 설정 데이터가 기록되고 있다.
검토자(Reviewer)
FRONTEO에서는 주로 1st 리뷰를 담당하고 있다.자사 제품 Lit i View나 Relativity(경쟁 제품)에서 데이터가 소송과 관련되는지 여부를 구분(데이터에 태그 지정, 코딩)한다.
리뷰 프로토콜(Review Protocol)
검토 배경과 태그 지정 기준이 포함된 절차.검토자가 검토를 수행하는 데 도움이 됩니다.
리뷰 관리자(Review Manager)
리뷰를 관리하는 사람.검토의 질과 진행을 관리하고 변호사 및 프로젝트 관리자에게 보고한다.