HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG
KHOA CƠNG NGHỆ THƠNG TIN
Học phần: An tồn mạng
Bài báo cáo:
Tìm hiểu về metagoofil trong kali linux
và một số demo
Giảng viên hướng dẫn:
Nhóm môn học:
Họ và tên:
Mã sinh viên:
Hà Nội 2021
TS. Đặng Minh Tuấn
02
Ngô Ngọc Đạt
B18DCAT048
MỤC LỤC
2
LỜI MỞ ĐẦU
Internet đang khơng ngừng phát triển và đóng vai trò quan trọng
trong cuộc sống của mội người. Nếu như ngày xưa, việc tìm tài liệu học
tập, tìm bài giảng thì chúng ta phải đi khắp các hiệu sách tìm kiếm có
đơi khi cịn khơng có kết quả mong muốn thì ngày nay khi Internet đã
phát triển mạnh mẽ thì việc đó trở nên dễ dàng hơn bao giờ hết chúng ta
chỉ cần tìm kiếm từ khóa trên google thì mọi thứ sẽ hiện ra cho chúng ta.
Metagoofil là một cơng cụ hữu ích để tối ưu hóa cơng việc tìm
kiếm tài liệu đó.Vậy tại sao lại là Metagoofil mà không phải là những
công cụ khác?Bởi Metagoofil không chỉ hỗ trợ tải về các tệp tin mà nó
cịn có thể ra soát và tải về tất cả các tệp tin mà trang web đã public trên
google chỉ bằng một dịng lệnh duy nhất.
Trong bài báo cáo này tơi sẽ chỉ ra các chức năng của công cụ
Metagoofil cùng với đó là cách sử dụng và các ví dụ trực quan nhất để
chúng ta có thể hiểu được cách thức hoạt động và tính năng của
metagoofil.
3
4
DANH MỤC CÁC TỪ VIẾT TẮT
Từ viết tắt
Từ đầy đủ
Giải nghĩa
Demo
Demonstration
Kiểm thử
Html
Hypertext marup
Ngôn ngữ đánh dấu siêu văn bản
Module
Module
Như một chương trình hoạt động riêng biệt
DANH MỤC HÌNH VẼ
5
6
7
Chương I. Khái quát về Metagoofil
1.Metagoofil là gì và lịch sử hình thành?
Metagoofil là một cơng cụ hữu ích để thu thập thông tin. Đây là
một công cụ mã nguồn mở và miễn phí được thiết kế để trích xuất tất cả
thông tin siêu dữ liệu từ các tài liệu cơng khai có sẵn trên các trang web.
Cơng cụ này sử dụng hai thư viện để trích xuất dữ liệu là Hachoir và
PdfMiner.Tuy nhiên phiên bản hiện tại thì metagoofil khơng cịn trích
xuất siêu dữ liệu nữa
Cơng cụ này cũng có thể trích xuất địa chỉ MAC từ các tài liệu văn
phịng của Microsoft. Cơng cụ này có thể cung cấp thông tin về phần
cứng của hệ thống đã tạo ra tài iệu đó.
Metagoofil được coded bởi Christian Martorella và cơng khai vào
ngày 26-05-2011.
2.Hướng dẫn cài đặt.
Metagoofil có sẵn trên kali linux tuy nhiên trên những bản cập nhật
mới của kali thì tool này đã bị loại bỏ nhưng việc cài đặt metagoofil trên
kali linux rất đơn giản bằng việc clone về máy.
8
9
Hình 1 Trang github hỗ trợ metagoofil
Bước 1: Khởi động Terminal.
Bước 2: Nhập lệnh sudo su và nhập mật khẩu để lấy quyền root.
Bước 3: Nhập git clone
để tải về và cài đặt.
10
Hình 2 Cài đạt metagoofill
Bước 4:nhập lệnh cd metagoofil để khởi chạy và nhập lệnh ls để
xem các module
11
Hình 3 Các module
3.Hướng dẫn sử dụng Metagoofil.
Metagoofil hoạt động bằng cách :
-Tìm kiếm các loại tập tin bằng cách sử dụng cơng cụ tìm kiếm
google.
-Tải tất cả các tài liệu nó tìm thấy và lưu trong ổ đĩa
-Trích xuất các siêu dữ liệu từ các tài liệu tải về
-Lưu các kết quả trong một tập tin html
Nhập lệnh python2 metagoofil.py để xem hướng dẫn sử dụng.
12
Hình 4 Các option
Lúc này sẽ hiển thị sô hiệu phiên bản, tên tác giả, trang web hỗ trợ
và các option:
-Metagoofil Ver 2.2
-Christian Martorella
-Edge-Security.com
-cmartorella_at_edge-security.com
-Các thơng tin có thể được tìm thấy bằng cách sử dụng siêu dữ liệu
là tên người dùng, đường dẫn, địa chỉ MAC, phần mềm, hệ điều
hành vv Những thơng tin này có thể được sử dụng sau này để giúp
đỡ trong giai đoạn thử nghiệm thâm nhập.
Các option:
-d: domain
-t: định dạng file cần download
(pdf,doc,xls,ppt,odp,ods,docx,xlsx,pptx)
-l: giới hạn kết quả cần tìm (mặc định 200)
-h: làm việc với các tài liệu (dùng "yes" để phân tích cục bộ)
-n: giới hạn tệp tải xuống
-o: thư mục làm việc (vị trí lưu tệp đã tải)
-f: xuất tệp
Chương II. Demo download tệp tin bằng
Metagoofil
1.demo trên trang web apple.com
13
14
Hình 5 Nhập lệnh rà quét
15
Hình 6 Bắt đầu rà quét
Python2 metagoofil.py -d apple.com -t doc,pdf -l 200 -n 10 -o
appl -f appl.html
Phân tích dịng lệnh :
Python2 metagoofil.py: cho phép chạy chương trình
metagoofil.py bằng python2.
-d apple.com: cho phép tool rà quét trên trang tệp tin trên tên miền
apple.com
-t doc,pdf :cho phép tool tải về những tệp có định dạng doc và pdf
-l 200: quy định chỉ rà sóat 200 tệp
-n 10: giới hạn chỉ được tải về 10 tệp tin
-0 appl: quyết định nơi lưu tệp đã tải về mà ở đây là
/home/kali/metagoofil/apple
-f appl.html : lưu một số thong tin trong file html
16
Hình 7 Các File rà quét được
17
Hình 8 File html khi đang rà quét
18
Hình 9 dữ liệu đã rà quét
19
Hình 10 Dữ liệu đã rà quét
20
Hình 11 Dữ liệu đã rà quét
21
Hình 12 Dữ liệu đã rà quét
Trang web sử dụng 5 username để upload tập tin:
-Brett Fernald
-Jerry Villa
-Sonnenberg, Paul
-Apple Inc.
Trang web sử dụng 10 phần mềm để soạn thảo 10 file đã tải về:
- Microsoft Word 12.1.2
- Apogee Series3 Pilot v1.0u1
-Mac OS X 10.4.11 Quartz PDFContext
- Word
-Adobe PDF Library 9.9
-Adobe InDesign CS5.5 (7.5.3)
-Mac OS X 10.10.2 Quartz PDFContext
-TextEdit
- macOS Version 11.4 (Build 20F57) Quartz PDFContext
- Pages
Trang web không sử dụng email, chỉ sử dụng 1 server là
Normal.dotm
22
23
Hình 13 Các file đã tải về
24
Hình 14 File tải về thành công
Tải thành công 6/10 tệp vì rà quét quá nhanh nên bị google chặn.
2. demo trên web infosecptit.com
25