Cách trích xuất văn bản từ PDF bằng các công cụ tích hợp miễn phí trên máy Mac của bạn

Định dạng Tài liệu Di động (PDF) là một cách tuyệt vời để chia sẻ tài liệu trong khi vẫn giữ nguyên định dạng, bố cục và thậm chí là bảo mật. Nhưng đôi khi bạn cần sao chép một số văn bản từ PDF và để lại tất cả hình ảnh và định dạng của tài liệu. Điều này có thể đặc biệt khó khăn khi văn bản bạn muốn bị tách và chia theo hình ảnh.

Vì vậy, làm thế nào để bạn sao chép chỉ cần văn bản từ PDF, trong khi bỏ qua hình ảnh và định dạng? Chà, ứng dụng TextEdit của Mac sẵn sàng trợ giúp!

Cách trích xuất văn bản từ PDF bằng các công cụ tích hợp miễn phí trên máy Mac của bạn

Bước 1: Mở tệp PDF

Bước đầu tiên là mở tệp PDF của bạn. Ứng dụng mặc định để xem tệp PDF trong macOS là ứng dụng Xem trước và đó là những gì bạn sẽ thấy trong ảnh chụp màn hình sau. Nếu bạn có ứng dụng PDF của bên thứ ba, chẳng hạn như Adobe Acrobat, các bước thực hiện tương tự.

bản xem trước tệp pdf mac

Đây là tệp demo tuyệt vời nhất BAO GIỜ.

Bước 2: Chọn Mọi thứ trong PDF

Thông thường, khi bạn cần chọn văn bản từ một tệp PDF có nhiều hình ảnh và định dạng, bạn có thể sử dụng con trỏ chuột hoặc bàn di chuột để chọn từng khối văn bản, sao chép nó vào khay nhớ tạm và sau đó dán nó vào mong muốn của bạn đơn xin. Và nếu bạn chỉ cần một chút văn bản, phương pháp này là tốt. Nhưng nếu bạn cần nhiều trang văn bản, điều này có thể mất vĩnh viễn. Câu trả lời là chỉ cần chọn tất cả và chúng tôi sẽ hướng dẫn bạn cách xử lý hình ảnh và định dạng tiếp theo.

Vì vậy, hãy chọn tất cả nội dung trong tệp PDF của bạn bằng cách đi tới Chỉnh sửa> Chọn tất cả hoặc bằng cách sử dụng phím tắt Lệnh-A.

pdf chọn tất cả

Sau khi làm như vậy, bạn sẽ thấy toàn bộ nội dung tài liệu của mình được chọn.

tập tin pdf đã chọn tất cả

Bước 3: Sao chép và dán nội dung PDF

Với nội dung PDF của bạn đã chọn, hãy đi tới Chỉnh sửa> Sao chép trong thanh menu hoặc sử dụng phím tắt Command-C. Tiếp theo, tìm và khởi chạy Chỉnh sửa văn bản ứng dụng, được đặt theo mặc định trong thư mục Ứng dụng của bạn. Bạn cũng có thể tìm kiếm nó qua Spotlight.

ứng dụng textedit mac

Tùy thuộc vào cài đặt TextEdit của bạn, bạn có thể cần tạo tài liệu mới khi khởi chạy ứng dụng. Nhấn vào Tài liệu mới ở góc dưới bên trái của cửa sổ để làm như vậy.

textedit tài liệu mới

Theo mặc định, tài liệu TextEdit mới của bạn sẽ mở ở chế độ Rich Text. Bạn sẽ cần thay đổi nó thành Chế độ văn bản thuần túy, vì đây là bí mật cho phép chúng tôi dán toàn bộ PDF nhưng chỉ xem văn bản. Để chuyển sang Chế độ văn bản thuần túy, hãy chọn Định dạng> Tạo văn bản thuần túyhoặc sử dụng phím tắt Shift-Command-T.

văn bản thuần túy textedit

Nếu bạn thấy Tạo văn bản đa dạng thức trong cửa sổ này trên máy Mac của riêng bạn, thì điều đó có nghĩa là tài liệu TextEdit của bạn đã ở Chế độ văn bản thuần túy.

Cuối cùng, sao chép nội dung PDF của bạn bằng cách chọn Chỉnh sửa> Dán từ thanh menu hoặc sử dụng phím tắt Command-V. Bởi vì chúng tôi đang ở Chế độ văn bản thuần túy, bạn sẽ thấy chỉ cần văn bản từ tệp PDF của bạn chứ không phải bất kỳ hình ảnh hoặc định dạng nào.

chỉnh sửa văn bản dán văn bản thuần túy

Văn bản của bạn có thể vẫn cần được làm sạch một chút về khoảng cách, nhưng nó sẽ dễ dàng xử lý hơn nhiều trong bất kỳ ứng dụng nào mà nó dành cho.

Phần thưởng: Buộc mở tất cả tài liệu TextEdit ở Chế độ văn bản thuần túy

Nếu bạn sẽ thực hiện quy trình sao chép-dán PDF này thường xuyên, bạn có thể đặt TextEdit mở ở Chế độ văn bản thuần túy theo mặc định, điều này có thể giúp bạn tiết kiệm một chút thời gian. Để làm như vậy, hãy chọn TextEdit> Preferences từ thanh menu.

Tùy chọn TextEdit

Từ cửa sổ Preferences, hãy chọn Tài liệu mới tab và chọn Văn bản thô trong phần "Định dạng".

textedit tài liệu mới văn bản thuần túy

Như đã đề cập, điều này có thể giúp bạn tiết kiệm thời gian, nhưng bạn luôn có thể chuyển các tài liệu TextEdit riêng lẻ trở lại Chế độ văn bản đa dạng thức bằng cách sử dụng phương pháp được mô tả trước đó. Vì vậy, bạn không bị mắc kẹt với cái này hay cái kia, nhưng chỉ cần lưu ý rằng nếu bạn chuyển tài liệu Văn bản đa dạng thức sang Văn bản thuần túy và sau đó chuyển trở lại sang Văn bản đa dạng thức, bạn sẽ mất tất cả định dạng trong quá trình này.