Member 14932762 Ответов: 1

Как проверить динамический текст в pdf-файле с помощью C# программно


Например, если у меня есть адрес xyz здесь слово address является статическим словом, но xyz будет динамически изменяться во всех файлах, может ли кто-нибудь помочь, как это закодировать?

Что я уже пробовал:

For example if I have address is xyz here the word address is static word but xyz will be dynamically changing in all files could anyone help how to code this?

Maciej Los

"слово-адрес является статическим словом, но и XYZ может быть динамически меняется" - ?!?
Что ты имеешь в виду? Что такое "xyz"?

1 Ответов

Рейтинг:
0

OriginalGriff

Вам нужно будет быть намного более конкретным с вашими правилами: очень возможно "вытащить" адрес (или любой другой элемент) из текста, но вы должны быть конкретны в том, какой префикс и суффикс его разделяют.

Только в приведенном выше примере вы можете сказать: "перед адресом будут слова "адрес есть", и он закончится" здесь "" - и тогда относительно просто построить регулярное выражение, которое извлекает "xyz" (или что бы это ни было в " реальном мире"):

(?<=address is ).*?(?= here)

Тогда легко получить адрес с помощью кода C#, используя это регулярное выражение:
using System.Text.RegularExpressions;
...
        public static Regex regex = new Regex("(?<=address is ).*?(?= here)", RegexOptions.CultureInvariant | RegexOptions.Compiled);
        private void MyButton_Click(object sender, EventArgs e)
            {
            string inputText = "For example if I have address is xyz here the word address is static word but xyz will be dynamically changing in all files could anyone help how to code this?";
            Match m = regex.Match(inputText);
            if (m.Success)
                {
                string address = m.Value;
                }
            }

Но... вам нужно будет внимательно посмотреть на реальные, живые данные и решить, какие префиксы и суффиксы вам действительно нужны.

Это может помочь:Экспрессо[^] - это бесплатно, и он проверяет, тестирует и генерирует регулярные выражения.