នាំចូលទិន្នន័យពី PDF ទៅ Excel តាមរយៈ Power Query

ភារកិច្ចផ្ទេរទិន្នន័យពីសៀវភៅបញ្ជីនៅក្នុងឯកសារ PDF ទៅសន្លឹក Microsoft Excel គឺតែងតែ "សប្បាយ" ។ ជាពិសេសប្រសិនបើអ្នកមិនមានកម្មវិធីទទួលស្គាល់ថ្លៃ ៗ ដូចជា FineReader ឬអ្វីមួយដូចនោះ។ ការចម្លងដោយផ្ទាល់ជាធម្មតាមិននាំទៅរកអ្វីដែលល្អនោះទេ ពីព្រោះ។ បន្ទាប់​ពី​បិទភ្ជាប់​ទិន្នន័យ​ដែល​បាន​ចម្លង​ទៅ​លើ​សន្លឹក ពួកវា​ទំនង​ជា​«​នៅ​ជាប់​គ្នា​»​ក្នុង​ជួរ​ឈរ​មួយ។ ដូច្នេះពួកគេនឹងត្រូវបំបែកដោយយកចិត្តទុកដាក់ដោយប្រើឧបករណ៍ អត្ថបទតាមជួរ ពីផ្ទាំង ទិន្នន័យ (ទិន្នន័យ — អត្ថបទ​ទៅ​ជួរ​ឈរ​).

ហើយជាការពិតណាស់ ការចម្លងគឺអាចធ្វើទៅបានសម្រាប់តែឯកសារ PDF ទាំងនោះដែលមានស្រទាប់អត្ថបទ ពោលគឺជាមួយនឹងឯកសារដែលទើបតែត្រូវបានស្កេនពីក្រដាសទៅជា PDF នោះវានឹងមិនដំណើរការជាគោលការណ៍ទេ។

តែវាមិនសោកស្ដាយទេ 🙂

ប្រសិនបើអ្នកមាន Office 2013 ឬ 2016 បន្ទាប់មកក្នុងរយៈពេលពីរបីនាទីដោយគ្មានកម្មវិធីបន្ថែម វាពិតជាអាចទៅរួចក្នុងការផ្ទេរទិន្នន័យពី PDF ទៅ Microsoft Excel ។ ហើយ Word និង Power Query នឹងជួយយើងក្នុងរឿងនេះ។

ជាឧទាហរណ៍ ចូរយើងយករបាយការណ៍ PDF នេះជាមួយនឹងអត្ថបទ រូបមន្ត និងតារាងជាច្រើនពីគេហទំព័ររបស់គណៈកម្មការសេដ្ឋកិច្ចសម្រាប់អឺរ៉ុប៖

នាំចូលទិន្នន័យពី PDF ទៅ Excel តាមរយៈ Power Query

... ហើយព្យាយាមដកវាចេញពីវាក្នុង Excel និយាយតារាងទីមួយ៖

នាំចូលទិន្នន័យពី PDF ទៅ Excel តាមរយៈ Power Query

តោះ​ទៅ!

ជំហាន 1. បើក PDF ក្នុង Word

សម្រាប់ហេតុផលមួយចំនួន មានមនុស្សតិចណាស់ដែលដឹង ប៉ុន្តែចាប់តាំងពីឆ្នាំ 2013 Microsoft Word បានរៀនបើក និងស្គាល់ឯកសារ PDF (សូម្បីតែស្កេន នោះគឺដោយគ្មានស្រទាប់អត្ថបទ!) នេះត្រូវបានធ្វើតាមរបៀបស្តង់ដារទាំងស្រុង៖ បើក Word ចុច ឯកសារ - បើក (ឯកសារ - បើក) ហើយបញ្ជាក់ទ្រង់ទ្រាយ PDF នៅក្នុងបញ្ជីទម្លាក់ចុះនៅជ្រុងខាងក្រោមខាងស្តាំនៃបង្អួច។

បន្ទាប់មកជ្រើសរើសឯកសារ PDF ដែលយើងត្រូវការហើយចុច បើកទូលាយ (បើក). Word ប្រាប់យើងថាវានឹងដំណើរការ OCR នៅលើឯកសារនេះទៅជាអត្ថបទ៖

នាំចូលទិន្នន័យពី PDF ទៅ Excel តាមរយៈ Power Query

យើងយល់ព្រម ហើយក្នុងរយៈពេលពីរបីវិនាទី យើងនឹងឃើញ PDF របស់យើងបើកសម្រាប់កែសម្រួលរួចហើយនៅក្នុង Word៖

នាំចូលទិន្នន័យពី PDF ទៅ Excel តាមរយៈ Power Query

ជាការពិតណាស់ ការរចនា រចនាប័ទ្ម ពុម្ពអក្សរ បឋមកថា និងបាតកថា។ ជាគោលការណ៍ នៅដំណាក់កាលនេះ វាមានការល្បួងរួចហើយក្នុងការចម្លងតារាងពីឯកសារទទួលស្គាល់ទៅក្នុង Word ហើយគ្រាន់តែបិទភ្ជាប់វាទៅក្នុង Excel ។ ពេលខ្លះវាដំណើរការ ប៉ុន្តែជាញឹកញាប់វានាំឱ្យមានការបង្ខូចទ្រង់ទ្រាយទិន្នន័យគ្រប់ប្រភេទ - ឧទាហរណ៍ លេខអាចប្រែទៅជាកាលបរិច្ឆេទ ឬនៅតែជាអត្ថបទ ដូចករណីរបស់យើង ពីព្រោះ។ PDF ប្រើ​ឧបករណ៍​មិន​បំបែក៖

នាំចូលទិន្នន័យពី PDF ទៅ Excel តាមរយៈ Power Query

ដូច្នេះសូមកុំកាត់ជ្រុង ប៉ុន្តែធ្វើឱ្យអ្វីៗគ្រប់យ៉ាងស្មុគស្មាញបន្តិច ប៉ុន្តែត្រូវ។

ជំហានទី 2៖ រក្សាទុកឯកសារជាគេហទំព័រ

បន្ទាប់មកដើម្បីផ្ទុកទិន្នន័យដែលទទួលបានទៅក្នុង Excel (តាមរយៈ Power Query) ឯកសាររបស់យើងនៅក្នុង Word ត្រូវតែរក្សាទុកជាទម្រង់ទំព័របណ្ដាញ – ទម្រង់នេះគឺជាប្រភេទភាគបែងទូទៅរវាង Word និង Excel ។

ដើម្បីធ្វើដូចនេះចូលទៅកាន់ម៉ឺនុយ ឯកសារ - រក្សាទុកជា (ឯកសារ - រក្សាទុកជា) ឬចុចគ្រាប់ចុច F12 នៅលើក្តារចុច និងនៅក្នុងបង្អួចដែលបើក សូមជ្រើសរើសប្រភេទឯកសារ គេហទំព័រក្នុងឯកសារមួយ។ (គេហទំព័រ - ឯកសារតែមួយ):

នាំចូលទិន្នន័យពី PDF ទៅ Excel តាមរយៈ Power Query

បន្ទាប់ពីរក្សាទុក អ្នកគួរតែទទួលបានឯកសារដែលមានផ្នែកបន្ថែម mhtml (ប្រសិនបើអ្នកឃើញផ្នែកបន្ថែមឯកសារនៅក្នុង Explorer)។

ដំណាក់កាលទី 3. ផ្ទុកឯកសារទៅ Excel តាមរយៈ Power Query

អ្នកអាចបើកឯកសារ MHTML ដែលបានបង្កើតនៅក្នុង Excel ដោយផ្ទាល់ ប៉ុន្តែបន្ទាប់មកយើងនឹងទទួលបាន មាតិកាទាំងអស់នៃ PDF ក្នុងពេលតែមួយ រួមជាមួយនឹងអត្ថបទ និងតារាងដែលមិនចាំបាច់ជាច្រើន ហើយទីពីរ យើងនឹងបាត់បង់ទិន្នន័យម្តងទៀតដោយសារតែមិនត្រឹមត្រូវ។ អ្នកបំបែក។ ដូច្នេះយើងនឹងធ្វើការនាំចូលទៅក្នុង Excel តាមរយៈកម្មវិធីបន្ថែម Power Query ។ នេះគឺជាកម្មវិធីបន្ថែមឥតគិតថ្លៃទាំងស្រុងដែលអ្នកអាចផ្ទុកទិន្នន័យទៅ Excel ពីប្រភពស្ទើរតែទាំងអស់ (ឯកសារ ថតឯកសារ ប្រព័ន្ធ ERP) ហើយបន្ទាប់មកបំប្លែងទិន្នន័យដែលទទួលបានតាមគ្រប់មធ្យោបាយដែលអាចធ្វើទៅបានដោយផ្តល់ឱ្យវានូវរូបរាងដែលចង់បាន។

ប្រសិនបើអ្នកមាន Excel 2010-2013 បន្ទាប់មកអ្នកអាចទាញយក Power Query ពីគេហទំព័រផ្លូវការរបស់ Microsoft - បន្ទាប់ពីដំឡើងរួចអ្នកនឹងឃើញផ្ទាំងមួយ។ សំណួរថាមពល. ប្រសិនបើអ្នកមាន Excel 2016 ឬថ្មីជាងនេះ នោះអ្នកមិនចាំបាច់ទាញយកអ្វីទាំងអស់ - មុខងារទាំងអស់ត្រូវបានបង្កើតរួចហើយនៅក្នុង Excel តាមលំនាំដើម ហើយមានទីតាំងនៅលើផ្ទាំង ទិន្នន័យ (កាលបរិច្ឆេទ) នៅក្នុងក្រុម ទាញយកនិងបម្លែង (ទទួលបាន & ប្រែក្លាយ).

ដូច្នេះយើងទៅផ្ទាំង ទិន្នន័យឬនៅលើផ្ទាំង សំណួរថាមពល ហើយជ្រើសរើសក្រុម ដើម្បីទទួលបានទិន្នន័យ or បង្កើតសំណួរ - ពីឯកសារ - ពី XML. ដើម្បីធ្វើឱ្យអាចមើលឃើញមិនត្រឹមតែឯកសារ XML ប៉ុណ្ណោះទេ ផ្លាស់ប្តូរតម្រងនៅក្នុងបញ្ជីទម្លាក់ចុះនៅជ្រុងខាងក្រោមខាងស្តាំនៃបង្អួចទៅ ឯកសារ​ទាំងអស់ (ឯកសារ​ទាំងអស់) ហើយបញ្ជាក់ឯកសារ MHTML របស់យើង៖

នាំចូលទិន្នន័យពី PDF ទៅ Excel តាមរយៈ Power Query

សូមចំណាំថាការនាំចូលនឹងមិនបញ្ចប់ដោយជោគជ័យទេ ពីព្រោះ។ Power Query រំពឹងថា XML ពីយើង ប៉ុន្តែយើងពិតជាមានទម្រង់ HTML ។ ដូច្នេះនៅក្នុងបង្អួចបន្ទាប់ដែលលេចឡើង អ្នកនឹងត្រូវចុចខាងស្តាំលើឯកសារដែលមិនអាចយល់បានចំពោះ Power Query ហើយបញ្ជាក់ទម្រង់របស់វា៖

នាំចូលទិន្នន័យពី PDF ទៅ Excel តាមរយៈ Power Query

បន្ទាប់ពីនោះ ឯកសារនឹងត្រូវបានទទួលស្គាល់យ៉ាងត្រឹមត្រូវ ហើយយើងនឹងឃើញបញ្ជីតារាងទាំងអស់ដែលវាមាន៖

នាំចូលទិន្នន័យពី PDF ទៅ Excel តាមរយៈ Power Query

អ្នក​អាច​មើល​មាតិកា​របស់​តារាង​ដោយ​ចុច​ប៊ូតុង​កណ្ដុរ​ឆ្វេង​ក្នុង​ផ្ទៃ​ខាង​ក្រោយ​ពណ៌​ស (មិន​មែន​នៅ​ក្នុង​ពាក្យ Table!) នៃ​ក្រឡា​ក្នុង​ជួរ​ឈរ​ទិន្នន័យ។

នៅពេលដែលតារាងដែលចង់បានត្រូវបានកំណត់សូមចុចលើពាក្យពណ៌បៃតង តារាង - ហើយអ្នក "ឆ្លងកាត់" ចូលទៅក្នុងមាតិការបស់វា:

នាំចូលទិន្នន័យពី PDF ទៅ Excel តាមរយៈ Power Query

វានៅសល់ដើម្បីធ្វើជំហានសាមញ្ញមួយចំនួនដើម្បី "សិត" មាតិការបស់វាពោលគឺ:

  1. លុបជួរឈរដែលមិនចាំបាច់ (ចុចខាងស្តាំលើបឋមកថាជួរឈរ - យក)
  2. ជំនួសចំនុចដោយសញ្ញាក្បៀស (ជ្រើសរើសជួរឈរ ចុចខាងស្តាំ - ការជំនួសតម្លៃ)
  3. ដកសញ្ញាស្មើគ្នានៅក្នុងបឋមកថា (ជ្រើសរើសជួរឈរ ចុចខាងស្តាំ - ការជំនួសតម្លៃ)
  4. យកបន្ទាត់ខាងលើចេញ (ទំព័រដើម - លុបបន្ទាត់ - លុបបន្ទាត់កំពូល)
  5. យកបន្ទាត់ទទេចេញ (ទំព័រដើម - លុបបន្ទាត់ - លុបបន្ទាត់ទទេ)
  6. លើកជួរទីមួយទៅក្បាលតារាង (ទំព័រដើម - ប្រើបន្ទាត់ទីមួយជាចំណងជើង)
  7. ត្រងទិន្នន័យដែលមិនចាំបាច់ដោយប្រើតម្រង

នៅពេលដែលតារាងត្រូវបាននាំយកទៅទម្រង់ធម្មតារបស់វា វាអាចត្រូវបាន unloaded នៅលើសន្លឹកជាមួយនឹងពាក្យបញ្ជា បិទហើយទាញយក (បិទ និងផ្ទុក) on មេ ផ្ទាំង។ ហើយ​យើង​នឹង​ទទួល​បាន​ភាព​ស្រស់​ស្អាត​ដូច​ដែល​យើង​អាច​ធ្វើ​ការ​បាន​ហើយ៖

នាំចូលទិន្នន័យពី PDF ទៅ Excel តាមរយៈ Power Query

  • បំប្លែង​ជួរ​ឈរ​ទៅ​ជា​តារាង​ដោយ​ប្រើ​សំណួរ​ថាមពល
  • ការបំបែកអត្ថបទស្អិតទៅជាជួរឈរ

សូមផ្ដល់យោបល់