មាតិកា
ភារកិច្ចផ្ទេរទិន្នន័យពីសៀវភៅបញ្ជីនៅក្នុងឯកសារ PDF ទៅសន្លឹក Microsoft Excel គឺតែងតែ "សប្បាយ" ។ ជាពិសេសប្រសិនបើអ្នកមិនមានកម្មវិធីទទួលស្គាល់ថ្លៃ ៗ ដូចជា FineReader ឬអ្វីមួយដូចនោះ។ ការចម្លងដោយផ្ទាល់ជាធម្មតាមិននាំទៅរកអ្វីដែលល្អនោះទេ ពីព្រោះ។ បន្ទាប់ពីបិទភ្ជាប់ទិន្នន័យដែលបានចម្លងទៅលើសន្លឹក ពួកវាទំនងជា«នៅជាប់គ្នា»ក្នុងជួរឈរមួយ។ ដូច្នេះពួកគេនឹងត្រូវបំបែកដោយយកចិត្តទុកដាក់ដោយប្រើឧបករណ៍ អត្ថបទតាមជួរ ពីផ្ទាំង ទិន្នន័យ (ទិន្នន័យ — អត្ថបទទៅជួរឈរ).
ហើយជាការពិតណាស់ ការចម្លងគឺអាចធ្វើទៅបានសម្រាប់តែឯកសារ PDF ទាំងនោះដែលមានស្រទាប់អត្ថបទ ពោលគឺជាមួយនឹងឯកសារដែលទើបតែត្រូវបានស្កេនពីក្រដាសទៅជា PDF នោះវានឹងមិនដំណើរការជាគោលការណ៍ទេ។
តែវាមិនសោកស្ដាយទេ 🙂
ប្រសិនបើអ្នកមាន Office 2013 ឬ 2016 បន្ទាប់មកក្នុងរយៈពេលពីរបីនាទីដោយគ្មានកម្មវិធីបន្ថែម វាពិតជាអាចទៅរួចក្នុងការផ្ទេរទិន្នន័យពី PDF ទៅ Microsoft Excel ។ ហើយ Word និង Power Query នឹងជួយយើងក្នុងរឿងនេះ។
ជាឧទាហរណ៍ ចូរយើងយករបាយការណ៍ PDF នេះជាមួយនឹងអត្ថបទ រូបមន្ត និងតារាងជាច្រើនពីគេហទំព័ររបស់គណៈកម្មការសេដ្ឋកិច្ចសម្រាប់អឺរ៉ុប៖
... ហើយព្យាយាមដកវាចេញពីវាក្នុង Excel និយាយតារាងទីមួយ៖
តោះទៅ!
ជំហាន 1. បើក PDF ក្នុង Word
សម្រាប់ហេតុផលមួយចំនួន មានមនុស្សតិចណាស់ដែលដឹង ប៉ុន្តែចាប់តាំងពីឆ្នាំ 2013 Microsoft Word បានរៀនបើក និងស្គាល់ឯកសារ PDF (សូម្បីតែស្កេន នោះគឺដោយគ្មានស្រទាប់អត្ថបទ!) នេះត្រូវបានធ្វើតាមរបៀបស្តង់ដារទាំងស្រុង៖ បើក Word ចុច ឯកសារ - បើក (ឯកសារ - បើក) ហើយបញ្ជាក់ទ្រង់ទ្រាយ PDF នៅក្នុងបញ្ជីទម្លាក់ចុះនៅជ្រុងខាងក្រោមខាងស្តាំនៃបង្អួច។
បន្ទាប់មកជ្រើសរើសឯកសារ PDF ដែលយើងត្រូវការហើយចុច បើកទូលាយ (បើក). Word ប្រាប់យើងថាវានឹងដំណើរការ OCR នៅលើឯកសារនេះទៅជាអត្ថបទ៖
យើងយល់ព្រម ហើយក្នុងរយៈពេលពីរបីវិនាទី យើងនឹងឃើញ PDF របស់យើងបើកសម្រាប់កែសម្រួលរួចហើយនៅក្នុង Word៖
ជាការពិតណាស់ ការរចនា រចនាប័ទ្ម ពុម្ពអក្សរ បឋមកថា និងបាតកថា។ ជាគោលការណ៍ នៅដំណាក់កាលនេះ វាមានការល្បួងរួចហើយក្នុងការចម្លងតារាងពីឯកសារទទួលស្គាល់ទៅក្នុង Word ហើយគ្រាន់តែបិទភ្ជាប់វាទៅក្នុង Excel ។ ពេលខ្លះវាដំណើរការ ប៉ុន្តែជាញឹកញាប់វានាំឱ្យមានការបង្ខូចទ្រង់ទ្រាយទិន្នន័យគ្រប់ប្រភេទ - ឧទាហរណ៍ លេខអាចប្រែទៅជាកាលបរិច្ឆេទ ឬនៅតែជាអត្ថបទ ដូចករណីរបស់យើង ពីព្រោះ។ PDF ប្រើឧបករណ៍មិនបំបែក៖
ដូច្នេះសូមកុំកាត់ជ្រុង ប៉ុន្តែធ្វើឱ្យអ្វីៗគ្រប់យ៉ាងស្មុគស្មាញបន្តិច ប៉ុន្តែត្រូវ។
ជំហានទី 2៖ រក្សាទុកឯកសារជាគេហទំព័រ
បន្ទាប់មកដើម្បីផ្ទុកទិន្នន័យដែលទទួលបានទៅក្នុង Excel (តាមរយៈ Power Query) ឯកសាររបស់យើងនៅក្នុង Word ត្រូវតែរក្សាទុកជាទម្រង់ទំព័របណ្ដាញ – ទម្រង់នេះគឺជាប្រភេទភាគបែងទូទៅរវាង Word និង Excel ។
ដើម្បីធ្វើដូចនេះចូលទៅកាន់ម៉ឺនុយ ឯកសារ - រក្សាទុកជា (ឯកសារ - រក្សាទុកជា) ឬចុចគ្រាប់ចុច F12 នៅលើក្តារចុច និងនៅក្នុងបង្អួចដែលបើក សូមជ្រើសរើសប្រភេទឯកសារ គេហទំព័រក្នុងឯកសារមួយ។ (គេហទំព័រ - ឯកសារតែមួយ):
បន្ទាប់ពីរក្សាទុក អ្នកគួរតែទទួលបានឯកសារដែលមានផ្នែកបន្ថែម mhtml (ប្រសិនបើអ្នកឃើញផ្នែកបន្ថែមឯកសារនៅក្នុង Explorer)។
ដំណាក់កាលទី 3. ផ្ទុកឯកសារទៅ Excel តាមរយៈ Power Query
អ្នកអាចបើកឯកសារ MHTML ដែលបានបង្កើតនៅក្នុង Excel ដោយផ្ទាល់ ប៉ុន្តែបន្ទាប់មកយើងនឹងទទួលបាន មាតិកាទាំងអស់នៃ PDF ក្នុងពេលតែមួយ រួមជាមួយនឹងអត្ថបទ និងតារាងដែលមិនចាំបាច់ជាច្រើន ហើយទីពីរ យើងនឹងបាត់បង់ទិន្នន័យម្តងទៀតដោយសារតែមិនត្រឹមត្រូវ។ អ្នកបំបែក។ ដូច្នេះយើងនឹងធ្វើការនាំចូលទៅក្នុង Excel តាមរយៈកម្មវិធីបន្ថែម Power Query ។ នេះគឺជាកម្មវិធីបន្ថែមឥតគិតថ្លៃទាំងស្រុងដែលអ្នកអាចផ្ទុកទិន្នន័យទៅ Excel ពីប្រភពស្ទើរតែទាំងអស់ (ឯកសារ ថតឯកសារ ប្រព័ន្ធ ERP) ហើយបន្ទាប់មកបំប្លែងទិន្នន័យដែលទទួលបានតាមគ្រប់មធ្យោបាយដែលអាចធ្វើទៅបានដោយផ្តល់ឱ្យវានូវរូបរាងដែលចង់បាន។
ប្រសិនបើអ្នកមាន Excel 2010-2013 បន្ទាប់មកអ្នកអាចទាញយក Power Query ពីគេហទំព័រផ្លូវការរបស់ Microsoft - បន្ទាប់ពីដំឡើងរួចអ្នកនឹងឃើញផ្ទាំងមួយ។ សំណួរថាមពល. ប្រសិនបើអ្នកមាន Excel 2016 ឬថ្មីជាងនេះ នោះអ្នកមិនចាំបាច់ទាញយកអ្វីទាំងអស់ - មុខងារទាំងអស់ត្រូវបានបង្កើតរួចហើយនៅក្នុង Excel តាមលំនាំដើម ហើយមានទីតាំងនៅលើផ្ទាំង ទិន្នន័យ (កាលបរិច្ឆេទ) នៅក្នុងក្រុម ទាញយកនិងបម្លែង (ទទួលបាន & ប្រែក្លាយ).
ដូច្នេះយើងទៅផ្ទាំង ទិន្នន័យឬនៅលើផ្ទាំង សំណួរថាមពល ហើយជ្រើសរើសក្រុម ដើម្បីទទួលបានទិន្នន័យ or បង្កើតសំណួរ - ពីឯកសារ - ពី XML. ដើម្បីធ្វើឱ្យអាចមើលឃើញមិនត្រឹមតែឯកសារ XML ប៉ុណ្ណោះទេ ផ្លាស់ប្តូរតម្រងនៅក្នុងបញ្ជីទម្លាក់ចុះនៅជ្រុងខាងក្រោមខាងស្តាំនៃបង្អួចទៅ ឯកសារទាំងអស់ (ឯកសារទាំងអស់) ហើយបញ្ជាក់ឯកសារ MHTML របស់យើង៖
សូមចំណាំថាការនាំចូលនឹងមិនបញ្ចប់ដោយជោគជ័យទេ ពីព្រោះ។ Power Query រំពឹងថា XML ពីយើង ប៉ុន្តែយើងពិតជាមានទម្រង់ HTML ។ ដូច្នេះនៅក្នុងបង្អួចបន្ទាប់ដែលលេចឡើង អ្នកនឹងត្រូវចុចខាងស្តាំលើឯកសារដែលមិនអាចយល់បានចំពោះ Power Query ហើយបញ្ជាក់ទម្រង់របស់វា៖
បន្ទាប់ពីនោះ ឯកសារនឹងត្រូវបានទទួលស្គាល់យ៉ាងត្រឹមត្រូវ ហើយយើងនឹងឃើញបញ្ជីតារាងទាំងអស់ដែលវាមាន៖
អ្នកអាចមើលមាតិការបស់តារាងដោយចុចប៊ូតុងកណ្ដុរឆ្វេងក្នុងផ្ទៃខាងក្រោយពណ៌ស (មិនមែននៅក្នុងពាក្យ Table!) នៃក្រឡាក្នុងជួរឈរទិន្នន័យ។
នៅពេលដែលតារាងដែលចង់បានត្រូវបានកំណត់សូមចុចលើពាក្យពណ៌បៃតង តារាង - ហើយអ្នក "ឆ្លងកាត់" ចូលទៅក្នុងមាតិការបស់វា:
វានៅសល់ដើម្បីធ្វើជំហានសាមញ្ញមួយចំនួនដើម្បី "សិត" មាតិការបស់វាពោលគឺ:
- លុបជួរឈរដែលមិនចាំបាច់ (ចុចខាងស្តាំលើបឋមកថាជួរឈរ - យក)
- ជំនួសចំនុចដោយសញ្ញាក្បៀស (ជ្រើសរើសជួរឈរ ចុចខាងស្តាំ - ការជំនួសតម្លៃ)
- ដកសញ្ញាស្មើគ្នានៅក្នុងបឋមកថា (ជ្រើសរើសជួរឈរ ចុចខាងស្តាំ - ការជំនួសតម្លៃ)
- យកបន្ទាត់ខាងលើចេញ (ទំព័រដើម - លុបបន្ទាត់ - លុបបន្ទាត់កំពូល)
- យកបន្ទាត់ទទេចេញ (ទំព័រដើម - លុបបន្ទាត់ - លុបបន្ទាត់ទទេ)
- លើកជួរទីមួយទៅក្បាលតារាង (ទំព័រដើម - ប្រើបន្ទាត់ទីមួយជាចំណងជើង)
- ត្រងទិន្នន័យដែលមិនចាំបាច់ដោយប្រើតម្រង
នៅពេលដែលតារាងត្រូវបាននាំយកទៅទម្រង់ធម្មតារបស់វា វាអាចត្រូវបាន unloaded នៅលើសន្លឹកជាមួយនឹងពាក្យបញ្ជា បិទហើយទាញយក (បិទ និងផ្ទុក) on មេ ផ្ទាំង។ ហើយយើងនឹងទទួលបានភាពស្រស់ស្អាតដូចដែលយើងអាចធ្វើការបានហើយ៖
- បំប្លែងជួរឈរទៅជាតារាងដោយប្រើសំណួរថាមពល
- ការបំបែកអត្ថបទស្អិតទៅជាជួរឈរ