| 1 |
|
|---|
| 2 |
|
|---|
| 3 |
|
|---|
| 4 |
|
|---|
| 5 |
|
|---|
| 6 |
|
|---|
| 7 |
|
|---|
| 8 |
|
|---|
| 9 |
|
|---|
| 10 |
|
|---|
| 11 |
|
|---|
| 12 |
|
|---|
| 13 |
|
|---|
| 14 |
|
|---|
| 15 |
|
|---|
| 16 |
|
|---|
| 17 |
|
|---|
| 18 |
|
|---|
| 19 |
|
|---|
| 20 |
|
|---|
| 21 |
|
|---|
| 22 |
|
|---|
| 23 |
|
|---|
| 24 |
|
|---|
| 25 |
|
|---|
| 26 |
|
|---|
| 27 |
|
|---|
| 28 |
|
|---|
| 29 |
|
|---|
| 30 |
#ifdef HAVE_CONFIG_H |
|---|
| 31 |
# include "config.h" |
|---|
| 32 |
#endif |
|---|
| 33 |
|
|---|
| 34 |
#include <vlc_common.h> |
|---|
| 35 |
#include <vlc_input.h> |
|---|
| 36 |
#include <vlc_charset.h> |
|---|
| 37 |
|
|---|
| 38 |
#ifdef HAVE_DIRENT_H |
|---|
| 39 |
# include <dirent.h> |
|---|
| 40 |
#endif |
|---|
| 41 |
|
|---|
| 42 |
#include <limits.h> |
|---|
| 43 |
|
|---|
| 44 |
#ifdef HAVE_UNISTD_H |
|---|
| 45 |
# include <unistd.h> |
|---|
| 46 |
#endif |
|---|
| 47 |
#include <sys/stat.h> |
|---|
| 48 |
|
|---|
| 49 |
#include <ctype.h> |
|---|
| 50 |
#include "input_internal.h" |
|---|
| 51 |
|
|---|
| 52 |
|
|---|
| 53 |
|
|---|
| 54 |
|
|---|
| 55 |
#define MAX_SUBTITLE_FILES 128 |
|---|
| 56 |
|
|---|
| 57 |
|
|---|
| 58 |
|
|---|
| 59 |
|
|---|
| 60 |
|
|---|
| 61 |
static const char const sub_exts[][6] = { |
|---|
| 62 |
"utf", "utf8", "utf-8", |
|---|
| 63 |
"sub", "srt", "smi", |
|---|
| 64 |
"txt", "ssa", "idx", |
|---|
| 65 |
|
|---|
| 66 |
"cdg", |
|---|
| 67 |
|
|---|
| 68 |
"" |
|---|
| 69 |
}; |
|---|
| 70 |
|
|---|
| 71 |
|
|---|
| 72 |
|
|---|
| 73 |
|
|---|
| 74 |
static void strcpy_trim( char *d, const char *s ) |
|---|
| 75 |
{ |
|---|
| 76 |
|
|---|
| 77 |
while( *s && !isalnum(*s) ) |
|---|
| 78 |
{ |
|---|
| 79 |
s++; |
|---|
| 80 |
} |
|---|
| 81 |
for(;;) |
|---|
| 82 |
{ |
|---|
| 83 |
|
|---|
| 84 |
while( *s && isalnum(*s) ) |
|---|
| 85 |
{ |
|---|
| 86 |
*d = tolower(*s); |
|---|
| 87 |
s++; d++; |
|---|
| 88 |
} |
|---|
| 89 |
if( *s == 0 ) break; |
|---|
| 90 |
|
|---|
| 91 |
while( *s && !isalnum(*s) ) |
|---|
| 92 |
{ |
|---|
| 93 |
s++; |
|---|
| 94 |
} |
|---|
| 95 |
if( *s == 0 ) break; |
|---|
| 96 |
*d++ = ' '; |
|---|
| 97 |
} |
|---|
| 98 |
*d = 0; |
|---|
| 99 |
} |
|---|
| 100 |
|
|---|
| 101 |
static void strcpy_strip_ext( char *d, const char *s ) |
|---|
| 102 |
{ |
|---|
| 103 |
const char *tmp = strrchr(s, '.'); |
|---|
| 104 |
if( !tmp ) |
|---|
| 105 |
{ |
|---|
| 106 |
strcpy(d, s); |
|---|
| 107 |
return; |
|---|
| 108 |
} |
|---|
| 109 |
else |
|---|
| 110 |
strlcpy(d, s, tmp - s + 1 ); |
|---|
| 111 |
while( *d ) |
|---|
| 112 |
{ |
|---|
| 113 |
*d = tolower(*d); |
|---|
| 114 |
d++; |
|---|
| 115 |
} |
|---|
| 116 |
} |
|---|
| 117 |
|
|---|
| 118 |
static void strcpy_get_ext( char *d, const char *s ) |
|---|
| 119 |
{ |
|---|
| 120 |
const char *tmp = strrchr(s, '.'); |
|---|
| 121 |
if( !tmp ) |
|---|
| 122 |
strcpy(d, ""); |
|---|
| 123 |
else |
|---|
| 124 |
strcpy( d, tmp + 1 ); |
|---|
| 125 |
} |
|---|
| 126 |
|
|---|
| 127 |
static int whiteonly( const char *s ) |
|---|
| 128 |
{ |
|---|
| 129 |
while( *s ) |
|---|
| 130 |
{ |
|---|
| 131 |
if( isalnum( *s ) ) |
|---|
| 132 |
return 0; |
|---|
| 133 |
s++; |
|---|
| 134 |
} |
|---|
| 135 |
return 1; |
|---|
| 136 |
} |
|---|
| 137 |
|
|---|
| 138 |
enum |
|---|
| 139 |
{ |
|---|
| 140 |
SUB_PRIORITY_NONE = 0, |
|---|
| 141 |
SUB_PRIORITY_MATCH_NONE = 1, |
|---|
| 142 |
SUB_PRIORITY_MATCH_RIGHT = 2, |
|---|
| 143 |
SUB_PRIORITY_MATCH_LEFT = 3, |
|---|
| 144 |
SUB_PRIORITY_MATCH_ALL = 4, |
|---|
| 145 |
}; |
|---|
| 146 |
typedef struct |
|---|
| 147 |
{ |
|---|
| 148 |
int priority; |
|---|
| 149 |
char *psz_fname; |
|---|
| 150 |
char *psz_ext; |
|---|
| 151 |
} vlc_subfn_t; |
|---|
| 152 |
|
|---|
| 153 |
static int compare_sub_priority( const void *a, const void *b ) |
|---|
| 154 |
{ |
|---|
| 155 |
const vlc_subfn_t *p0 = a; |
|---|
| 156 |
const vlc_subfn_t *p1 = b; |
|---|
| 157 |
|
|---|
| 158 |
if( p0->priority > p1->priority ) |
|---|
| 159 |
return -1; |
|---|
| 160 |
|
|---|
| 161 |
if( p0->priority < p1->priority ) |
|---|
| 162 |
return 1; |
|---|
| 163 |
|
|---|
| 164 |
#ifndef UNDER_CE |
|---|
| 165 |
return strcoll( p0->psz_fname, p1->psz_fname); |
|---|
| 166 |
#else |
|---|
| 167 |
return strcmp( p0->psz_fname, p1->psz_fname); |
|---|
| 168 |
#endif |
|---|
| 169 |
} |
|---|
| 170 |
|
|---|
| 171 |
|
|---|
| 172 |
|
|---|
| 173 |
|
|---|
| 174 |
int subtitles_Filter( const char *psz_dir_content ) |
|---|
| 175 |
{ |
|---|
| 176 |
const char *tmp = strrchr( psz_dir_content, '.'); |
|---|
| 177 |
int i; |
|---|
| 178 |
|
|---|
| 179 |
if( !tmp ) |
|---|
| 180 |
return 0; |
|---|
| 181 |
tmp++; |
|---|
| 182 |
|
|---|
| 183 |
for( i = 0; sub_exts[i][0]; i++ ) |
|---|
| 184 |
if( strcasecmp( sub_exts[i], tmp ) == 0 ) |
|---|
| 185 |
return 1; |
|---|
| 186 |
return 0; |
|---|
| 187 |
} |
|---|
| 188 |
|
|---|
| 189 |
|
|---|
| 190 |
|
|---|
| 191 |
|
|---|
| 192 |
|
|---|
| 193 |
static char **paths_to_list( const char *psz_dir, char *psz_path ) |
|---|
| 194 |
{ |
|---|
| 195 |
unsigned int i, k, i_nb_subdirs; |
|---|
| 196 |
char **subdirs; |
|---|
| 197 |
char *psz_parser = psz_path; |
|---|
| 198 |
|
|---|
| 199 |
if( !psz_dir || !psz_path ) |
|---|
| 200 |
return NULL; |
|---|
| 201 |
|
|---|
| 202 |
for( k = 0, i_nb_subdirs = 1; psz_path[k] != '\0'; k++ ) |
|---|
| 203 |
{ |
|---|
| 204 |
if( psz_path[k] == ',' ) |
|---|
| 205 |
i_nb_subdirs++; |
|---|
| 206 |
} |
|---|
| 207 |
|
|---|
| 208 |
subdirs = calloc( i_nb_subdirs + 1, sizeof(char*) ); |
|---|
| 209 |
if( !subdirs ) |
|---|
| 210 |
return NULL; |
|---|
| 211 |
|
|---|
| 212 |
for( i = 0; psz_parser && *psz_parser != '\0' ; ) |
|---|
| 213 |
{ |
|---|
| 214 |
char *psz_subdir = psz_parser; |
|---|
| 215 |
psz_parser = strchr( psz_subdir, ',' ); |
|---|
| 216 |
if( psz_parser ) |
|---|
| 217 |
{ |
|---|
| 218 |
*psz_parser++ = '\0'; |
|---|
| 219 |
while( *psz_parser == ' ' ) |
|---|
| 220 |
psz_parser++; |
|---|
| 221 |
} |
|---|
| 222 |
if( *psz_subdir == '\0' ) |
|---|
| 223 |
continue; |
|---|
| 224 |
|
|---|
| 225 |
if( asprintf( &subdirs[i++], "%s%s%c", |
|---|
| 226 |
psz_subdir[0] == '.' ? psz_dir : "", |
|---|
| 227 |
psz_subdir, |
|---|
| 228 |
psz_subdir[strlen(psz_subdir) - 1] == DIR_SEP_CHAR ? |
|---|
| 229 |
'\0' : DIR_SEP_CHAR ) == -1 ) |
|---|
| 230 |
break; |
|---|
| 231 |
} |
|---|
| 232 |
subdirs[i] = NULL; |
|---|
| 233 |
|
|---|
| 234 |
return subdirs; |
|---|
| 235 |
} |
|---|
| 236 |
|
|---|
| 237 |
|
|---|
| 238 |
|
|---|
| 239 |
|
|---|
| 240 |
|
|---|
| 241 |
|
|---|
| 242 |
|
|---|
| 243 |
|
|---|
| 244 |
|
|---|
| 245 |
|
|---|
| 246 |
|
|---|
| 247 |
|
|---|
| 248 |
|
|---|
| 249 |
|
|---|
| 250 |
|
|---|
| 251 |
|
|---|
| 252 |
|
|---|
| 253 |
char **subtitles_Detect( input_thread_t *p_this, char *psz_path, |
|---|
| 254 |
const char *psz_name_org ) |
|---|
| 255 |
{ |
|---|
| 256 |
vlc_value_t fuzzy; |
|---|
| 257 |
int j, i_result2, i_sub_count, i_fname_len; |
|---|
| 258 |
char *f_dir = NULL, *f_fname = NULL, *f_fname_noext = NULL, *f_fname_trim = NULL; |
|---|
| 259 |
char *tmp = NULL; |
|---|
| 260 |
|
|---|
| 261 |
char **subdirs; |
|---|
| 262 |
|
|---|
| 263 |
vlc_subfn_t *result = NULL; |
|---|
| 264 |
char **result2; |
|---|
| 265 |
const char *psz_fname = psz_name_org; |
|---|
| 266 |
|
|---|
| 267 |
if( !psz_fname ) |
|---|
| 268 |
return NULL; |
|---|
| 269 |
|
|---|
| 270 |
if( !strncmp( psz_fname, "file://", 7 ) ) |
|---|
| 271 |
psz_fname += 7; |
|---|
| 272 |
|
|---|
| 273 |
|
|---|
| 274 |
tmp = strrchr( psz_fname, DIR_SEP_CHAR ); |
|---|
| 275 |
if( tmp ) |
|---|
| 276 |
{ |
|---|
| 277 |
const int i_dirlen = strlen(psz_fname)-strlen(tmp)+1; |
|---|
| 278 |
f_fname = strdup( &tmp[1] ); |
|---|
| 279 |
f_dir = strndup( psz_fname, i_dirlen ); |
|---|
| 280 |
} |
|---|
| 281 |
else |
|---|
| 282 |
{ |
|---|
| 283 |
#ifdef HAVE_UNISTD_H |
|---|
| 284 |
|
|---|
| 285 |
char *psz_cwd = getcwd( NULL, 0 ); |
|---|
| 286 |
#else |
|---|
| 287 |
char *psz_cwd = NULL; |
|---|
| 288 |
#endif |
|---|
| 289 |
if( !psz_cwd ) |
|---|
| 290 |
return NULL; |
|---|
| 291 |
|
|---|
| 292 |
f_fname = strdup( psz_fname ); |
|---|
| 293 |
if( asprintf( &f_dir, "%s%c", psz_cwd, DIR_SEP_CHAR ) == -1 ) |
|---|
| 294 |
f_dir = NULL; |
|---|
| 295 |
free( psz_cwd ); |
|---|
| 296 |
} |
|---|
| 297 |
if( !f_fname || !f_dir ) |
|---|
| 298 |
{ |
|---|
| 299 |
free( f_fname ); |
|---|
| 300 |
free( f_dir ); |
|---|
| 301 |
return NULL; |
|---|
| 302 |
} |
|---|
| 303 |
|
|---|
| 304 |
i_fname_len = strlen( f_fname ); |
|---|
| 305 |
|
|---|
| 306 |
f_fname_noext = malloc(i_fname_len + 1); |
|---|
| 307 |
f_fname_trim = malloc(i_fname_len + 1 ); |
|---|
| 308 |
if( !f_fname_noext || !f_fname_trim ) |
|---|
| 309 |
{ |
|---|
| 310 |
free( f_fname ); |
|---|
| 311 |
free( f_dir ); |
|---|
| 312 |
free( f_fname_noext ); |
|---|
| 313 |
free( f_fname_trim ); |
|---|
| 314 |
return NULL; |
|---|
| 315 |
} |
|---|
| 316 |
|
|---|
| 317 |
strcpy_strip_ext( f_fname_noext, f_fname ); |
|---|
| 318 |
strcpy_trim( f_fname_trim, f_fname_noext ); |
|---|
| 319 |
|
|---|
| 320 |
var_Get( p_this, "sub-autodetect-fuzzy", &fuzzy ); |
|---|
| 321 |
|
|---|
| 322 |
result = calloc( MAX_SUBTITLE_FILES+1, sizeof(vlc_subfn_t) ); |
|---|
| 323 |
subdirs = paths_to_list( f_dir, psz_path ); |
|---|
| 324 |
for( j = -1, i_sub_count = 0; (j == -1) || ( j >= 0 && subdirs != NULL && subdirs[j] != NULL ); j++ ) |
|---|
| 325 |
{ |
|---|
| 326 |
const char *psz_dir = j < 0 ? f_dir : subdirs[j]; |
|---|
| 327 |
char **ppsz_dir_content; |
|---|
| 328 |
int i_dir_content; |
|---|
| 329 |
int a; |
|---|
| 330 |
|
|---|
| 331 |
if( psz_dir == NULL || ( j >= 0 && !strcmp( psz_dir, f_dir ) ) ) |
|---|
| 332 |
continue; |
|---|
| 333 |
|
|---|
| 334 |
|
|---|
| 335 |
i_dir_content = utf8_scandir( psz_dir, &ppsz_dir_content, |
|---|
| 336 |
subtitles_Filter, NULL ); |
|---|
| 337 |
if( i_dir_content < 0 ) |
|---|
| 338 |
continue; |
|---|
| 339 |
|
|---|
| 340 |
msg_Dbg( p_this, "looking for a subtitle file in %s", psz_dir ); |
|---|
| 341 |
for( a = 0; a < i_dir_content && i_sub_count < MAX_SUBTITLE_FILES ; a++ ) |
|---|
| 342 |
{ |
|---|
| 343 |
char *psz_name = ppsz_dir_content[a]; |
|---|
| 344 |
char tmp_fname_noext[strlen( psz_name ) + 1]; |
|---|
| 345 |
char tmp_fname_trim[strlen( psz_name ) + 1]; |
|---|
| 346 |
char tmp_fname_ext[strlen( psz_name ) + 1]; |
|---|
| 347 |
|
|---|
| 348 |
int i_prio; |
|---|
| 349 |
|
|---|
| 350 |
if( psz_name == NULL ) |
|---|
| 351 |
continue; |
|---|
| 352 |
|
|---|
| 353 |
|
|---|
| 354 |
strcpy_strip_ext( tmp_fname_noext, psz_name ); |
|---|
| 355 |
strcpy_get_ext( tmp_fname_ext, psz_name ); |
|---|
| 356 |
strcpy_trim( tmp_fname_trim, tmp_fname_noext ); |
|---|
| 357 |
|
|---|
| 358 |
i_prio = SUB_PRIORITY_NONE; |
|---|
| 359 |
if( i_prio == SUB_PRIORITY_NONE && !strcmp( tmp_fname_trim, f_fname_trim ) ) |
|---|
| 360 |
{ |
|---|
| 361 |
|
|---|
| 362 |
i_prio = SUB_PRIORITY_MATCH_ALL; |
|---|
| 363 |
} |
|---|
| 364 |
if( i_prio == SUB_PRIORITY_NONE && |
|---|
| 365 |
( tmp = strstr( tmp_fname_trim, f_fname_trim ) ) ) |
|---|
| 366 |
{ |
|---|
| 367 |
|
|---|
| 368 |
tmp += strlen( f_fname_trim ); |
|---|
| 369 |
if( whiteonly( tmp ) ) |
|---|
| 370 |
{ |
|---|
| 371 |
|
|---|
| 372 |
i_prio = SUB_PRIORITY_MATCH_RIGHT; |
|---|
| 373 |
} |
|---|
| 374 |
else |
|---|
| 375 |
{ |
|---|
| 376 |
|
|---|
| 377 |
|
|---|
| 378 |
i_prio = SUB_PRIORITY_MATCH_LEFT; |
|---|
| 379 |
} |
|---|
| 380 |
} |
|---|
| 381 |
if( i_prio == SUB_PRIORITY_NONE && |
|---|
| 382 |
j == 0 ) |
|---|
| 383 |
{ |
|---|
| 384 |
|
|---|
| 385 |
i_prio = SUB_PRIORITY_MATCH_NONE; |
|---|
| 386 |
} |
|---|
| 387 |
if( i_prio >= fuzzy.i_int ) |
|---|
| 388 |
{ |
|---|
| 389 |
char psz_path[strlen( psz_dir ) + strlen( psz_name ) + 1]; |
|---|
| 390 |
struct stat st; |
|---|
| 391 |
|
|---|
| 392 |
sprintf( psz_path, "%s%s", psz_dir, psz_name ); |
|---|
| 393 |
if( !strcmp( psz_path, psz_fname ) ) |
|---|
| 394 |
continue; |
|---|
| 395 |
|
|---|
| 396 |
if( !utf8_stat( psz_path, &st ) && S_ISREG( st.st_mode ) && result ) |
|---|
| 397 |
{ |
|---|
| 398 |
msg_Dbg( p_this, |
|---|
| 399 |
"autodetected subtitle: %s with priority %d", |
|---|
| 400 |
psz_path, i_prio ); |
|---|
| 401 |
result[i_sub_count].priority = i_prio; |
|---|
| 402 |
result[i_sub_count].psz_fname = strdup( psz_path ); |
|---|
| 403 |
result[i_sub_count].psz_ext = strdup(tmp_fname_ext); |
|---|
| 404 |
i_sub_count++; |
|---|
| 405 |
} |
|---|
| 406 |
else |
|---|
| 407 |
{ |
|---|
| 408 |
msg_Dbg( p_this, "stat failed (autodetecting subtitle: %s with priority %d)", |
|---|
| 409 |
psz_path, i_prio ); |
|---|
| 410 |
} |
|---|
| 411 |
} |
|---|
| 412 |
} |
|---|
| 413 |
if( ppsz_dir_content ) |
|---|
| 414 |
{ |
|---|
| 415 |
for( a = 0; a < i_dir_content; a++ ) |
|---|
| 416 |
free( ppsz_dir_content[a] ); |
|---|
| 417 |
free( ppsz_dir_content ); |
|---|
| 418 |
} |
|---|
| 419 |
} |
|---|
| 420 |
if( subdirs ) |
|---|
| 421 |
{ |
|---|
| 422 |
for( j = 0; subdirs[j]; j++ ) |
|---|
| 423 |
free( subdirs[j] ); |
|---|
| 424 |
free( subdirs ); |
|---|
| 425 |
} |
|---|
| 426 |
free( f_fname ); |
|---|
| 427 |
free( f_dir ); |
|---|
| 428 |
free( f_fname_trim ); |
|---|
| 429 |
free( f_fname_noext ); |
|---|
| 430 |
|
|---|
| 431 |
if( !result ) |
|---|
| 432 |
return NULL; |
|---|
| 433 |
|
|---|
| 434 |
qsort( result, i_sub_count, sizeof(vlc_subfn_t), compare_sub_priority ); |
|---|
| 435 |
|
|---|
| 436 |
result2 = calloc( i_sub_count + 1, sizeof(char*) ); |
|---|
| 437 |
|
|---|
| 438 |
for( j = 0, i_result2 = 0; j < i_sub_count && result2 != NULL; j++ ) |
|---|
| 439 |
{ |
|---|
| 440 |
bool b_reject = false; |
|---|
| 441 |
|
|---|
| 442 |
if( !result[j].psz_fname || !result[j].psz_ext ) |
|---|
| 443 |
break; |
|---|
| 444 |
|
|---|
| 445 |
if( !strcasecmp( result[j].psz_ext, "sub" ) ) |
|---|
| 446 |
{ |
|---|
| 447 |
int i; |
|---|
| 448 |
for( i = 0; i < i_sub_count; i++ ) |
|---|
| 449 |
{ |
|---|
| 450 |
if( result[i].psz_fname && result[i].psz_ext && |
|---|
| 451 |
!strncasecmp( result[j].psz_fname, result[i].psz_fname, |
|---|
| 452 |
strlen( result[j].psz_fname) - 3 ) && |
|---|
| 453 |
!strcasecmp( result[i].psz_ext, "idx" ) ) |
|---|
| 454 |
break; |
|---|
| 455 |
} |
|---|
| 456 |
if( i < i_sub_count ) |
|---|
| 457 |
b_reject = true; |
|---|
| 458 |
} |
|---|
| 459 |
else if( !strcasecmp( result[j].psz_ext, "cdg" ) ) |
|---|
| 460 |
{ |
|---|
| 461 |
if( result[j].priority < SUB_PRIORITY_MATCH_ALL ) |
|---|
| 462 |
b_reject = true; |
|---|
| 463 |
} |
|---|
| 464 |
|
|---|
| 465 |
|
|---|
| 466 |
if( !b_reject ) |
|---|
| 467 |
result2[i_result2++] = strdup( result[j].psz_fname ); |
|---|
| 468 |
} |
|---|
| 469 |
|
|---|
| 470 |
for( j = 0; j < i_sub_count; j++ ) |
|---|
| 471 |
{ |
|---|
| 472 |
free( result[j].psz_fname ); |
|---|
| 473 |
free( result[j].psz_ext ); |
|---|
| 474 |
} |
|---|
| 475 |
free( result ); |
|---|
| 476 |
|
|---|
| 477 |
return result2; |
|---|
| 478 |
} |
|---|
| 479 |
|
|---|