Data file
File | 2Load_innms,innm_dosages,brands |
Page | "New-198-2017-07-26" |
Upload steps & logic
Step 0- Prepare & clean original data
- Copy table from original PDF file (http://www.moz.gov.ua/docfiles/dn_20170728_875_dod..pdf) and paste into Google tables file.
- Del separate rows (between page, head of document, etc)
- Add 0-column `Status`
- Add 17- column `Мінімальна кратність відпуску` & fill column `0`
- Replace symbol `,` on `.` into all amount & digital column (5,6,11-16)
- Replace Cyrillic symbol `А`, `В`, `С` on Latin symbol `A`, `B`, `C` into column 7
- Replace text `необмеженний`(etc) on `31.12.3000` into column 10
- Del text symbols into all amount & digital column (5,6,11-16)
- Create pivot table for check & repair `form` (see page `FORM`). Update problem rows
- Export table to `*.csv` file
- Del 2-s first rows in file (header of table)
Step 1- Load data into temp table on DB
- Connect to DB
Create temp table
- Import data into `_temp_reestr` from csv-file
Check count loaded rows
Step 2- Load Innms
Create temp table
- Source page "innm"
- Mapping:
- innm_identifier = column `C`
- name = column `A`
- Check exist by `innm_identifier`
- If not exist - Insert new.
- status=INACTIVE (DICTIONARY: innm_status)
- is_active=TRUE
- If not exist - Insert new.
Step 2 - Load Routes
- Source page: "Dic: route"
- Mapping:
- name = column `A`
- Check exist by `value`
- If not exist - Insert new.
Step 3 - Add Countries
- Manually add new values into Dictionary: COUNTRY
- TBD !!!!
Step 4 - Load Medications
- Source page: "Original-2017-07-26"
- Delete * from medications (delete old data)
- Mapping:
- name = column `C`(3)
is_active = TRUE
- start_at = `2017/07/26`
- end_at = `3000/01/01`
- route = column `D`(4) + search in Dictionary `medication_route` by name
- container_dosage = Mapping procedure Container Dosage
- package_qty = column `G`(6)
- package_min_qty = column `G`(6)
- code_ATX = column `H`(7)
- manufacturer_name_country =column `I`(8) + Parsing procedure Manufacturer & Country
- certificate = column `J`(9)
- expired_certificate_date = column `K`(10) + format `DD.MM.YYYY`
- Cascade load ingredients (see Step 5)
Step 5 - Load Ingredients
- Source page: "Original-2017-07-26"
- Delete * from ingredients where medications_id (delete old data)
- Mapping:
- medication_id = parent
- innm_id = Search by innm.name
- is_active_substance = TRUE
- dosage
- numerator_value = column `E`(5) + Mapping procedure Dosage
Mapping procedure Dosage
- numerator_unit = mapping by medications.route
- аерозоль для інгаляцій = dose
- Аерозоль для інгаляцій, дозований = dose
- інгаляція під тиском = dose
- Порошок для інгаляцій = dose
- Суспензія для розпилення = ml
- таблетки = pill
- таблетки з модифікованим вивільненням = pill
- таблетки сублінгвальні = pill
- таблетки, вкриті оболонкою = pill
- таблетки, вкриті плівковою = pill
- таблетки, вкриті плівковою оболонкою = pill
- таблетки,вкриті оболонкою = pill
- numerator_value = column `E`(5)
- denumerator_unit mapping by numerator_unit
- pill = pill
- container = ml
- aerosol = dose
- denumerator_value = `1`
Mapping procedure Container Dosage
- numerator_unit = mapping by medications.route
- аерозоль для інгаляцій = aerosol
- Аерозоль для інгаляцій, дозований = aerosol
- інгаляція під тиском = aerosol
- Порошок для інгаляцій = aerosol
- Суспензія для розпилення = container
- таблетки = pill
- таблетки з модифікованим вивільненням = pill
- таблетки сублінгвальні = pill
- таблетки, вкриті оболонкою = pill
- таблетки, вкриті плівковою = pill
- таблетки, вкриті плівковою оболонкою = pill
- таблетки,вкриті оболонкою = pill
- numerator_value = `1`
- denumerator_unit mapping by numerator_unit
- pill = pill
- container = ml
- aerosol = dose
- denumerator_value = `1`
Parsing procedure Manufacturer & Country
- Parsing string by format: `manufacturer_name`,`country_name`
- Examples:
- Юнікем Лабораторіз Лімітед , Індія;
- Асіно Фарма АГ , Швейцарія
- Mapping for structure Manufacturer_info
- name = `manufacturer_name`
- country = `country_name` search in Dictionary `Country` by name