Creo que antes de empezar a programar debes terminar de analizar el caso.
¿Hasta cuántos y cuáles datos pueden estar contenidos en estas descripciones? Por ejemplo, ¿"
ACITE DE OLIVA CARBONELL LATA 24/200 ML" son tres, cuatro o cinco datos? ('ACITE DE OLIVA CARBONELL', 'LATA', 24, 200, ML) ¿Qué significa ese 24? ¿24 unidades por caja...?
¿Los datos entonces serían nombre, presentación, unidades por empaque, tamaño y unidad de medida? ¿O da igual que los dos primeros vayan juntos?
Tomando los ejemplos que nos has dado, identifico una posible regla sintáctica:
Todas, casi todas o la gran mayoría de las descripciones que llevan un tamaño ("
gramaje") y unidad de medida, contienen una diagonal seguida por un dígito decimal (12
/170 GR, C
/19 LT, 12
/5X200 GR) ¿Es correcta la afirmación?
¿Qué significa esa
X en "
12/5X200"? Entiendo que es un "por", pero ¿cómo influye en la estructura de datos que estamos analizando?
Otra pregunta, ¿es posible que existan descripciones con más de una diagonal o que ésta no forme parte del dato que indica el tamaño? Por ejemplo:
"Chocolate Nicklaus Wirth 1/4 de leche 12/150 GR".
Esperamos sin prisa tu retroalimentación.