Error using id_filename on certain files with non-ascii letters in magic string #21

hile · 2019-07-11T05:02:22Z

I have one JPEG file which can't be parsed with id_filename. I guess it contains copyright sign in non-unicode format?

file artwork.jpg
artwork.jpg: JPEG image data, JFIF standard 1.01, resolution (DPCM), density 59x59, segment length 16, comment: "File written by Adobe Photoshop� 5.0", baseline, precision 8, 200x200, frames 3

python -c 'import magic; magic.Magic().id_filename("artwork.jpg")'
Traceback (most recent call last):
File "", line 1, in
File "/usr/local/lib/python3.7/site-packages/magic/identify.py", line 29, in wrapper
return func(self, *args, **kwargs)
File "/usr/local/lib/python3.7/site-packages/magic/compatability.py", line 30, in wrapper
return func(*encoder(args), **kwargs)
File "/usr/local/lib/python3.7/site-packages/magic/compatability.py", line 56, in wrapper
return value.decode()
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xa8 in position 131: invalid start byte

urwithajit9 · 2019-08-23T05:04:52Z

Hi Hile,
Can you share the artwork.jpg? I want to reproduce the error to work on it.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Error using id_filename on certain files with non-ascii letters in magic string #21

Error using id_filename on certain files with non-ascii letters in magic string #21

hile commented Jul 11, 2019

urwithajit9 commented Aug 23, 2019

Error using id_filename on certain files with non-ascii letters in magic string #21

Error using id_filename on certain files with non-ascii letters in magic string #21

Comments

hile commented Jul 11, 2019

urwithajit9 commented Aug 23, 2019